Статья опубликована в рамках: XX Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 04 мая 2017 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
ПРИМЕНЕНИЕ ПОДСИСТЕМЫ АНАЛИЗА ДАННЫХ И МАШИННОГО ОБУЧЕНИЯ ДЛЯ ИССЛЕДОВАНИЯ ВЛИЯНИЯ ЗАГРЯЗНЕНИЯ ВОЗДУХА НА КОЛИЧЕСТВО ПАЦИЕНТОВ С НАРУШЕНИЯМИ ДЫХАНИЯ
Проведение исследований по оценке влияния окружающей среды на здоровье людей является важным инструментом для демонстрации необходимости принятия мер по улучшению качества воздуха и снижения негативного воздействия экологических факторов.
Существует большое количество работ, посвященных воздействию загрязнения воздуха на здоровье человека. Исследования в различных географических районах показали зависимость респираторных симптомов и состояний с долгосрочным воздействием общих взвешенных частиц (TSP) и SO2 [1-7], твердых частиц [8-10], черного дыма [11] и NO2 [7]. Кроме того, некоторые исследования госпитализаций и смертности указывают на связь краткосрочного и долгосрочного воздействия загрязнения воздуха с симптомами, присущими как легочным, так и сердечным заболеваниям [12-19].
Таким образом, было принято решение провести подобное исследование в городе Ницца (Франция). В его основу легли данные о загрязнении воздуха в данном регионе, полученные при помощи сервиса AirPaca [20], предоставляющего показания датчиков в открытом доступе. Замеры атмосферного воздуха проводились в 6 районах: Contes 2, Aéroport de Nice, Nice Promenade des Anglais, Nice Arson, Peillon, Nice Ouest Botanique. Для получения сведений о пациентах был использован архив госпиталя Pasteur (Ницца).
Статистический анализ данных был проведен с использованием языка R. R — это язык программирования с открытым исходным кодом, а также программная среда для статистических вычислений и графики, поддерживаемая R Foundation [21]. Он позволяет группировать и фильтровать данные, автоматически вычислять коэффициенты корреляции, а также создавать необходимые графики для визуализации.
Для расчетной меры зависимости между величинами использовался коэффициент линейной корреляции Пирсона. Он получается путем деления ковариации двух переменных на произведение их стандартных отклонений, и рассчитывается по формуле [22]:
где — среднее значение выборок.
Поиск корреляции проводился для следующих наборов данных:
· набор данных о пациентах и состоянии воздуха без применения фильтрации;
· набор данных о пациентах и состоянии воздуха с применением фильтрации по диагнозу (пациенты с заболеваниями легких);
· набор данных о пациентах и состоянии воздуха с применением фильтрации по диагнозу (пациенты с заболеваниями сердца);
· сгруппированные по 5 дней наборы данных о пациентах и состоянии воздуха (в этом случае учитывается наличие инкубационного периода у заболеваний, а также время воздействия вредных составляющих атмосферного воздуха).
В ходе вычислений были получены результаты, представленные в таблицах 1-3.
Таблица 1.
Результаты для нефильтрованных данных
Набор данных 1 |
Набор данных 2 |
Коэффициент корреляции |
Оксид азота(II) |
Пациенты |
0.1804087 |
Оксид азота (IV) |
Пациенты |
0.1012164 |
Оксид азота |
Пациенты |
0.1616413 |
Озон |
Пациенты |
-0.2199504 |
Частицы PM10 |
Пациенты |
0.05497636 |
Частицы PM2,5 |
Пациенты |
0.0786113 |
Таблица 2.
Результаты для данных, фильтрованных по диагнозу
Набор данных 1 |
Набор данных 2 |
Коэффициент корреляции |
Оксид азота(II) |
Пациенты(заболевания легких) |
0.1719213 |
Оксид азота (IV) |
Пациенты(заболевания легких) |
0.08888615 |
Оксид азота |
Пациенты(заболевания легких) |
0.1535681 |
Озон |
Пациенты(заболевания легких) |
-0.2045952 |
Частицы PM10 |
Пациенты(заболевания легких) |
0.06846391 |
Частицы PM2,5 |
Пациенты(заболевания легких) |
0.0973422 |
Оксид азота(II) |
Пациенты(заболевания сердца) |
0.1060834 |
Оксид азота (IV) |
Пациенты(заболевания сердца) |
0.03138159 |
Оксид азота |
Пациенты(заболевания сердца) |
0.08371402 |
Озон |
Пациенты(заболевания сердца) |
-0.1386231 |
Частицы PM10 |
Пациенты(заболевания сердца) |
-0.005957092 |
Частицы PM2,5 |
Пациенты(заболевания сердца) |
0.002553244 |
Таблица 3.
Результаты для нефильтрованных данных
Набор данных 1 |
Набор данных 2 |
Коэффициент корреляции |
Оксид азота(II) |
Пациенты |
0.36395 |
Оксид азота (IV) |
Пациенты |
0.2697953 |
Оксид азота |
Пациенты |
0.3613143 |
Озон |
Пациенты |
-0.371573 |
Частицы PM10 |
Пациенты |
0.1243245 |
Частицы PM2,5 |
∆Пациенты |
0.1249298 |
Таким образом, наибольшее значения коэффициента корреляции с набором данных о пациентах имеет оксид азота, но оно недостаточно для утверждения существования корреляции данного вещества с ростом количества пациентов. Связь соответствующих наборов данных представлена на графике 1:
График 1. Зависимость роста количества пациентов от количества оксида азота в воздухе
Выводы
· анализ представленных данных не доказал существование линейной корреляции между загрязнением воздуха в Ницце и количеством пациентов с нарушениями дыхания;
· так как наибольший коэффициент наблюдается для оксида азота, необходимо продолжить исследование по поиску взаимосвязи количества пациентов с количеством данного вещества в воздухе, используя другие методы и средства машинного обучения;
· предложено разработать алгоритмы на языке R, позволяющие определять факторы риска для людей с нарушениями дыхания для будущей классификации пациента и составления индивидуальных рекомендаций.
Список литературы:
- The urban factor in chronic bronchitis / W. Holland, D. Reid // Lancet. – 1965. – P.445-448.
- Pollution atmosphérique et affections respiratoires chroniques ou à répétition / J. Lelouche // PAARC: Groupe Cooperative. – 1982. – P.87-116.
- Health effects of air pollution due to coal combustion in the Chestnut Ridge region of Pennsylvania: results of cross-sectional analysis in adults / M. Schenker, J. Samet, F. Speizer, J. Gruhl, S. Batterman // Arch. Environ. Health. – 1983. – P.325-330.
- Chronic obstructive pulmonary disease symptom effects of long term cumulative exposure to ambient levels of total suspended particulates and sulfur dioxide in California Seventh-Day Adventist residents / G. Euler, D. Abbey, A. Magie, J. Hodlkin // Arch. Environ. Health. – 1983. – P.213-222.
- Urban air quality and respiratory disease / P. Portney, J. Mullahy // Reg. Sci. Urban Econ. – 1990. – P. 407-418.
- Particulate air pollution and chronic respiratory disease / J. Schwartz // Environ. Res. – 1993. – P. 7-13.
- Prevalence of respiratory and hyperreactivity symptoms in relation to levels of criteria air pollutants in Sweden / B. Forsberg, N. Stjernberg, S. Wall // Eur. J. Public Health. – 1997. – P. 291-296.
- Long-term ambient concentrations of particulates and oxidants and development of chronic disease in a cohort of nonsmoking California residents / D. Abbey, M. Lebowitz, P. Mills, F. Petersen, W. Beeson, R. Burchette // Inhal. Toxicol. – 1995. – P. 21-34.
- Chronic respiratory symptoms associated with estimated long-term ambient concentrations of fine particulates less than 2.5 microns in aerodynamic diameter (PM2.5) and other air pollutants / D. Abbey, B. Ostro, F. Petersen, R. Burchette // Exp. Anal. Environ. Epidemiol. – 1995. – P. 137-159.
- Estimated long term ambient concentrations of PM10 and development of respiratory symptoms in a nonsmoking population / D. Abbey, B. Hwang, R. Burchette // Arch. Environ. Health. – 1995. – P. 139-150.
- Effect of ambient levels of smoke and sulphur dioxide on the health of a national sample of 23-year-old subjects in 1981 / J. Scarlett, J. Griffiths, D. Strachan, H. Anderson // Thorax. – 1995. – P. 764-768.
- Increased mortality in Philadelphia associated with daily air pollution concentrations / J. Schwartz, D. Dockery // Eur. Respir. – 1994. – P. 954-960.
- Air pollution and daily mortality in Erfurt, East Germany, 1980–1989 / C. Spix, J. Heinrich, D. Dockery, J. Schwartz, G. Volksch, K. Schwinkowski, C. Collen, H. Wichmann // Environ. Health Perspect. – 1993. – P. 518-526.
- An association between air pollution and mortality in six U.S. cities / D. Dockery, A. Pope, X. Xu, J. Spengler, J. War, M. Fay, B. Ferris, F. Speizer // Engl. J. Med. – 1993. – P. 1753-1759.
- Short-term effects of air pollution on daily mortality in Athens—a time-series analysis / G. Touloumi, S. Pocock, K. Katsouyanni, D. Trichopoulos // Int. J. Epidemiol. – 1994. – P. 957-967.
- Air pollution and daily mortality: a review and meta-analysis / J. Schwartz // Environ. Res. – 1994. – P. 36-52.
- Particulate air pollution as a predictor of mortality in a prospective study of U.S. adults / A. Pope, M. Thun M. // Respir. Crit. Care Med. – 1995. – P. 669-674.
- Air pollution and hospital admissions for cardiovascular disease in Detroit, Michigan / J. Schwartz, R. Morris R // Am. J. Epidemiol. – 1995. – P. 23-25.
- Associations between ambient particulate sulfate and admissions to Ontario Hospitals for cardiac and respiratory diseases / R. Burnett, R. Dales, D. Krewski // Am. J. Epidemiol. – 1995. –P. 15-22.
- AirPaca. Association de surveillance de la qualité de l'air agréée par le ministère de l'environnement [Электронный ресурс]. Режим доступа: http://www.airpaca.org/
- Wikipedia. R (programming language) [Электронный ресурс]. Режим доступа: https://en.wikipedia.org/wiki/R_(programming_language)
- Wikipedia. Correlation and dependence [Электронный ресурс]. Режим доступа: https://en.wikipedia.org/wiki/Correlation_and_dependence
дипломов
Оставить комментарий