Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: V Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 22 октября 2012 г.)

Наука: Математика

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Мещерякова Ю.А. ОРГАНИЗАЦИЯ ПРОЦЕДУРЫ ПРОГНОЗИРОВАНИЯ КОНЦЕНТРАЦИЙ ВРЕДНЫХ ВЕЩЕСТВ В ВОЗДУШНОЙ СРЕДЕ ПО СТАТИСТИЧЕСКИМ ДАННЫМ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. V междунар. студ. науч.-практ. конф. № 5. URL: https://sibac.info/archive/technic/5.pdf (дата обращения: 10.01.2025)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
Диплом лауреата
отправлен участнику

ОРГАНИЗАЦИЯ ПРОЦЕДУРЫ ПРОГНОЗИРОВАНИЯ КОНЦЕНТРАЦИЙ ВРЕДНЫХ ВЕЩЕСТВ В ВОЗДУШНОЙ СРЕДЕ ПО СТАТИСТИЧЕСКИМ ДАННЫМ

Мещерякова Юлия Александровна

магистрант 2 курса, кафедра высшей математики ЕГФ, ЮФУ, г. Таганрог

E-maillife-super@yandex.ru

Гадельшин Валерий Камельянович

научный руководитель, канд. тех. наук, доцент кафедры ВМ, ЕГФ, ЮФУ, г. Таганрог


 


Одной из главных экологических проблем в городах является высокий уровень загрязнения воздушной среды. Основные источники выбросов вредных, загрязняющих атмосферу веществ — автотранспорт и промышленные предприятия. Например, в 2009 году на долю автотранспорта в г. Таганроге приходилось 79,1 % от общего объема выбросов загрязняющих веществ, а по данным УГИБДД ГУВД по Ростовской области количество автомобилей в Таганроге с 35 тысяч в 2001 году к 2010 году увеличилось до 61000 единиц. Вблизи транспортных магистралей с интенсивным движением при неблагоприятных метеоусловиях и заторах содержание вредных примесей в воздухе значительно превышает допустимый уровень.


Сложность проведения регулярных трудоемких натурных экспериментов для оперативной и долговременной оценки и прогнозирование состояния воздушной среды приводит к необходимости применения вычислительных экспериментов методами математического моделирования и обработки статистических данных.


В данной работе предлагается метод и программный комплекс, позволяющие на основе статистических данных по выбросам загрязняющих веществ автотранспортом в экологически проблемных местах г. Таганрога, выполнять оперативный прогноз концентрации вредных веществ в атмосфере при заданных метеорологических условиях и составе транспортного потока.


Для оперативного прогноза концентрации загрязняющих веществ разработан алгоритм, состоящий из следующих процедур: создание базы данных, выборка данных из БД по точечным и интервальным запросам; выявление решающих параметров; нормализация данных; классификация замеров по месту и метеоусловиям; группирование замеров на основе алгоритмов кластеризации; выявление принадлежности исходной точки к тому или иному кластеру; формирование прогноза концентрации веществ, характерных для данной группы замеров.


Исходными данными являются замеры концентрации загрязняющих веществ в воздухе, сведения по составу автомобилей в потоке, метеоусловия с привязкой к месту и времени проводимых измерений, выполняемых ФГУЗ «Центром гигиены и эпидемиологии» в г. Таганроге в течение более десяти лет. Они позволяют характеризовать обстановку в городе в целом, а также служат для всестороннего анализа оценок и прогнозов. Пример исходных данных приведен в таблице 1.


Таблица 1.


Перекресток: Александровская — Гоголевский


Дата: 12.04.05


Время:


Тип машин


Кол-во


Метеоусловия


Грузовые + диз.


36


Давление


756


Легковые


620



14


Дизельные


 



14


Автобусы


10


Влажность


60


Мотоциклы


 


Напр. ветра


Ю-З


Трактора


 


Скорость


2-3


Маршрутки


64


Облачность


переменная облачность


Газы


Пробы


Норма



0,02


0,02


0,08


0,02


 


0,085



0,04


0,04


0,04


0,04


 


0,5


Форм


0,01


0,01


0,01


0,01


 


0,035


Сажа


0,025


0,025


0,025


0,025


 


0,15


Озон


0,001


0,004


0,002


0,002


 


0,16


CO


3,0


1,0


3,0


2,0


 


5,0

                   


 


На основе анализа исходных данных и различных СУБД для поддержки  программного комплекса используется: Microsoft SQL Server 2008 R2 Express (для базы данных) и Microsoft Visual Studio Express 2010 (для программного продукта) (см. рисунок 1).

 Описание: Структура

Рисунок 1. Состав и структура базы данных


 


Импорт данных из БД в программу осуществляется с помощью стандартных функций ADO.NET. Решающими параметрами выбраны: место проводимых измерений (на концентрацию вредных веществ в атмосфере имеет влияние рельеф местности и застройка); тип погоды; температура; давление; скорость ветра; количество машин по типам.


Общий вклад загрязняющих веществ, вносимых каждым элементом, определяется расчетным путем с использованием коэффициентов, полученных с применением методики, изложенной в [9, с. 15]. При разных значениях коэффициентов проведена верификация базы данных, и выбраны те, для которых получено наименьшее расхождение между исходными и прогнозируемыми значениями концентраций. Подобная практика использования коэффициентов встречается в работах [4, с. 193], в которых оценивалось влияние каждого метеопараметра на степень загрязнения, и полученные результаты использовали для составления прогноза загрязнения.


После нормализации данные представляются в удобном для использования виде.


Результатом нормализации является модель данных, которую легко поддерживать, и она не содержит неопределенностей в данных и повторений. В данном случае, все замеры для типов автомобилей находятся на некотором отрезке [a,b], который нормализуется в [0,1], и значение x [a,b] вычисляется по формуле , [0,1].


Кластерный анализ — задача разбиения множества замеров на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов (замеров), а объекты разных кластеров существенно отличались. Кластер — группа элементов, характеризуемых общим свойством, главная цель кластерного анализа — нахождение групп схожих объектов в выборке. Решение задачи кластеризации зависит от параметров кластеризации: критерия «похожести» элементов (после нормализации данные-замеры представляются в виде точек в евклидовом пространстве с набором координат-параметров, критерий похожести — это сходство координат, т. е. насколько близко в пространстве находятся точки); от используемой метрики d, измеряющей расстояние между векторами-образами (пространство является евклидовым, метрику вычисляем стандартно); от оцениваемого числа кластеров (оптимальное число кластеров ориентировочно предполагается равным 6, что основывается на исходном количестве замеров); нахождение нетипичных элементов (т. е. элементов, не попадающих ни в один из кластеров, имеет значение при формировании кластеров из данных БД, поскольку замеры неоднородны).


Задача кластеризации формулируется следующим образом. Дана обучающая выборка — множество всех замеров Ω = {x1,…,xn}. Требуется найти  такую функцию кластеризации f , которая  каждой точке (замер с решающими параметрами) x ∈ Ω ставила бы в однозначное соответствие некоторый элемент — метку z ∈ Z из множества меток Z = {z1,…,zn}[6, с. 38]. Обучающая выборка, используя один из алгоритмов кластеризации, разделяется на необходимые подгруппы внутри уже полученных классов по месту измерения и подклассов типа погоды.


Анализ алгоритмов кластеризации показывает, что для решения данной задачи рационально использовать максиминный алгоритм, поскольку он прост для реализации, обучается быстрее и не чувствителен к размерности (по сравнению с алгоритмом k-means). На рисунке 2 приведен пример кластеризации.


1.  В качестве первого центра кластера выбирается элемент c1 = x1 .


2.  Вторым центром кластера выбирается тот элемент c2 = , который находится на наибольшем расстоянии от c1, т. е.  .


3.  Предположим, что выбраны k — центров C(k) ={c1,…,ck} кластеров. В качестве  очередного (k+1) — го центра кластера выбирается тот элемент  , который  находится на наибольшем расстоянии от ближайшего из центров c1,…,ck (рис. 2), т. е.


4.  .


5.  Проверяется условие останова — мы установили число кластеров равное 6, как оптимальное для количества замеров в БД.


 

Рисунок 2. Определение центров кластеров и относящихся к ним элементов. c1 , с2, c3 — центры кластеров


 


Данные о концентрации примеси и относящиеся к ним ситуации группируются так, чтобы выделить 6 групп (кластеров) значений потока, причем сначала формируются группы по месту замера (количество — 6), затем подгруппы по типу погоды (количество — 3 для каждого класса). Пусть замеры описываются векторами-характеристиками , i=1,2,…,n. Для группы, состоящей из Mj ситуаций, определяются центр тяжести i-й характеристики Xi и средняя дисперсия.


Например, для 1 кластера


 



 


Для каждой из групп выделяется по одному вектору-характеристике таким образом, чтобы эти векторы имели наиболее низкие степени близости между собой. При разбиении совокупности на два кластера (m=2) выбирается два вектора-представителя с минимальной близостью между собой, т. е. определяются номера , из условия: , где – числа характеризующие подобие, определяются формулой:


 



 


При m=3 к двум уже выбранным векторам  добавляется третий вектор , где  выбирается из условия


 



 


которое позволяет выбрать третий вектор с наименьшей степенью близости совокупности первых двух.


  Если уже выбраны m-1 векторов , то вектор  выбирается из оставшихся векторов-характеристик по условию



 


Описание: untitled5

Рисунок 3. Кластеры


 


Распределение на кластеры заканчивается, если


 ,


 


где  — достаточно малое число.


Если считать, что среди проведенных наблюдений зафиксированы все возможные метеорологические ситуации, то прогноз методом распознавания образов связан с выбором из множества кластеров таких ситуаций (кластеров), которые близки к «прогнозируемой». В основе применения метода распознавания образов лежит представление о том, что большие концентрации примесей связаны с вполне определенными метеорологическими ситуациями и характером предшествующего загрязнения воздуха. Конкретный комплекс характеристик используется для определения группы, к которой можно отнести прогнозируемую ситуацию (процедура «обучения»). Для каждой конкретной ситуации, характеризуемой в фазовом пространстве точкой y с координатами , определяется расстояние до центра тяжести кластера.


 



 


Аналогично находится расстояние до остальных групп.


Ситуация y относится к той группе, расстояние до которой минимально. Далее считается средняя концентрация каждого вещества, характерного для данного кластера:


 


,


 

где n — количество элементов в кластере, xj — концентрация вещества.


Чтобы убедиться в том, что программа работает корректно, проведен ряд вычислительных экспериментов. Из БД случайным образом извлекается замер, который задается в качестве прогнозируемой ситуации, и далее сравниваются прогнозируемая концентрация и исходные данные.


Пример:


В качестве прогнозируемой ситуации вводится существующий замер, удаленный из базы (рис. 4). Работа программы отражена на рисунках 4—6.


 


Рисунок 4. Параметры прогнозируемой ситуации


 

Рисунок 5. Кластер, к которому отнесена прогнозируемая ситуация

 

Рисунок 6. Прогнозируемая концентрация веществ для заданных условий


 

Рисунок 7. Исходные данные по концентрации вредных веществ при заданных условиях


 


На рисунках 6 и 7 результаты для сравнения: прогнозируемая концентрация близка к действительной. Проверка показала, что 14 из 15 замеров совпали по оценке (отклонение до 3 %) с тем прогнозом, что рассчитан программным комплексом, а интервал разброса для оставшихся замеров составляет от 3 % до 10 %, что показывает достаточно успешную работу программного комплекса.


На основе полученной прогнозированием концентрации можно контролировать ситуацию загрязнения на автотранспортных магистралях.


Программный комплекс позволяет делать прогноз концентрации вредных веществ в воздушной среде в городских условиях, и может использоваться в экологических службах, в частности в «Центре гигиены и эпидемиологии в Ростовской области».


Для повышения эффективности работы программного комплекса в дальнейшем предполагается добавление в него процедуры «переобучения». Приведенные в данной работе результаты, подтверждают возможность построения таких схем на базе методов распознавания образов.

 

Список литературы:


1.Авдеева Т.П. Расчет выброса загрязняющих вещест»: Учеб. пособие. — Пенза, 1997. — 87 с.


2.Агаев Т.Б., Беккер А.А. Охрана и контроль загрязнения природной среды. — Л.: Гидрометеоиздат, 1989. — 67 с.


3.Белов П.Н., Семенченко Б.А. Метеорологические аспекты охраны природной среды. Изд-во МГУ, 1984. — 96 с.


4.Берлянд М.Е. Прогноз и регулирование загрязнения атмосферы. — Л: Гидрометеоиздат, 1985 — 271 с.


5.Берлянд М.Е. Современные проблемы атмосферной диффузии и загрязнения атмосферы. — Л: Гидрометеоиздат, 1975. — 448 с.


6.Броневич А.Г., Лепский А.Е. Математические методы распознавания образов. Курс лекций. — Таганрог: Изд-во ТТИ ЮФУ, 2009. — 155 с.


7.Генихович Е.Л., Гущин В.А., Сонькин Л.Р. О возможности прогноза загрязнения городского воздуха методом распознавания образов. Труды ГГО, 1969, вып. 238.


8.Метеорологические аспекты загрязнения атмосферы. Сб. докладов на международном симпозиуме в Ленинграде. Под ред. Берлянда М.Е., — Л.: Гидрометеоиздат, 1971. — 51 с.


9.Методика расчетов выбросов в атмосферу загрязняющих веществ автотранспортом на городских магистралях. — М.: НИИАТ, 1997. — 54 с.


10.Назаров И.М., Николаев А.Н., Фридман Ш.Д. Основы дистанционных методов мониторинга загрязнения природной среды. — Л.: Гидрометеоиздат. 1983. — 213 с.


11.Руководящий документ. Охрана природы. Атмосфера. Руководство по прогнозу загрязнения воздуха. РД 52.04.306-92

Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
Диплом лауреата
отправлен участнику

Оставить комментарий