Статья опубликована в рамках: XIX Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 15 апреля 2014 г.)
Наука: Технические науки
Секция: Моделирование
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
дипломов
РЕШЕНИЕ ЗАДАЧИ О МОДЕЛИРОВАНИИ ЗАВИСИМОСТИ КОЛИЧЕСТВА СОВЕРШЕННЫХ ПРЕСТУПЛЕНИЙ ОТ РАЗЛИЧНЫХ ФАКТОРОВ МЕТОДОМ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Новикова Ксения Алексеевна
студент 2-го курса, факультет СПО, ТИУиЭ, РФ, г. Таганрог
E-mail:
Самойленко Екатерина Николаевна
студент 2-го курса, факультет СПО, ТИУиЭ, РФ, г. Таганрог
E-mail:
Сахарова Ольга Николаевна
научный руководитель, канд. техн. наук, доцент ТИУиЭ, РФ, г. Таганрог
В настоящее время является актуальным поиск методов моделирования и прогнозирования роста количества совершаемых преступлений. Для решения этой задачи может быть использован метод линейной парной регрессии, хорошо зарекомендовавший себя в моделировании экономических систем. Метод линейной парной регрессии достаточно прост и позволяет с заданным уровнем погрешности проводить моделирование и прогнозирование различных процессов.
Уравнение линейной парной регрессии имеет вид (1) [4]:
(1),
где: у — зависимая переменная (результативный признак);
х — независимая, объясняющая переменная (признак-фактор),
ɛ — случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Официальным источником данных для анализа в РФ является РОССТАТ, который содержит официальные результаты статистических исследований. Все действия и отчеты РОССТАТа подвергаются международной проверке, и были признаны надежными. Поэтому для проведения данного исследования были использована информация официальной статистики, опубликованные на федеральном портале РОССТАТа [2].
В данном случае была поставлена задача провести моделирование зависимости количества совершенных преступлений в год от количества потребления алкоголя, а также от количества беженцев и вынужденных переселенцев в нашу страну. Исходные данные задачи представлены в таблице 1 и таблице 2.
Таблица 1.
Данные РОССТАТа для решения задачи линейной парной регрессии (зависимость количества совершенных преступлений от количества зарегистрированных больных алкоголизмом)
Год |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
2012 |
Зарегистрировано больных алкоголизмом, тыс.чел |
209,2 |
192,9 |
174,9 |
173,4 |
159,7 |
153,9 |
138,1 |
122,8 |
Количество преступления в год, тыс.чел |
3554,7 |
3855,4 |
3582,5 |
3209,9 |
2994,8 |
2628,8 |
2404,8 |
2302,2 |
Таблица 2.
Данные РОССТАТа для решения задачи линейной парной регрессии (зависимость количества совершенных преступлений от количества вынужденных переселенцев и беженцев РФ)
Год |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
2012 |
Количество вынужденных переселенцев и беженцев, тыс.чел |
8914 |
7177 |
6802 |
4337 |
4092 |
2135 |
2096 |
2554 |
Количество преступлений в год, тыс.чел |
3554,7 |
3855,4 |
3582,5 |
3209,9 |
2994,8 |
2628,8 |
2404,8 |
2302,2 |
Моделирование проводилось с помощью встроенных функций табличного процессора Microsoft Excel [5]. Для этого была разработана специальная форма (рисунок 1), которая позволяет провести анализ зависимости количества совершенных преступлений от любых факторов. Для проведения расчетов в качестве независимой переменной выступают количество зарегистрированных больных алкоголизмом и количество беженцев и вынужденных переселенцев в РФ, а в качестве результативного признака — соответственно количество зарегистрированных преступлений.
Рисунок 1. Форма для проведения расчетов парной линейной регрессии в MS Excel
Решение задачи включает в себя 4 основных этапа:
1. Построение поля корреляции. Для построения поля корреляции необходимо сформировать область данных, на основании которых с помощью встроенной опции График табличный процессор MS Excel автоматически строит поле корреляции зависимостей уровня преступности от количества эмигрантов и количества потребления алкоголя (рисунок 2) [1].
Рисунок 2. Поле корреляции
2. Нахождение параметров уравнения парной линейной регрессии. Для оценки параметров регрессий, линейных по параметрам, используется метод наименьших квадратов (МНК) [3], который позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна. Для оценки параметров уравнения парной линейной регрессии используются следующие формулы [3]:
,(2)
где: xi — значение независимой переменной, взятое из таблицы исходных данных,
— среднее значение независимой переменной,
у i — значение результативного признака,
— среднее значение результативного признака. Для определения значение параметров уравнения парной регрессии в табличном процессоре MS Excel была создана специальная форма проведения промежуточных расходов (рисунок 3) [5].
Рисунок 3. Таблицы промежуточных расчетов
Таким образом, в результате расчетов получаются следующие уравнения парной линейной регрессии:
у=-70,418+18,9421х (3) — уравнение зависимости количество совершенных преступлений от количества зарегистрированных больных алкоголизмом; данное уравнение показывает, что на каждую единицу изменения (для расчетов рассматривались тыс.человек, на каждую тысячу) больных алкоголизмом, приходится почти 19 тыс. преступлений;
у=2091,12+0,2048х (4) — уравнение зависимости количество совершенных преступлений от количества беженцев и вынужденных переселенцев в РФ, соответственно на каждую тысячу беженцев и вынужденных переселенцев приходится почти 205 преступлений.
3. Расчёт линейного коэффициента корреляции и коэффициента детерминации. Проведенные на третьем этапе предварительные расчеты позволяют достаточно быстро рассчитать (рисунок 4) коэффициент корреляции (5) и коэффициент детерминации (6) [4]:
, где , 2 (5) и (6)
Рисунок 4. Расчет коэффициентов корреляции и детерминации
Полученный коэффициент корреляции (рисунок 4а), подтверждает вывод, сделанный в пункте 1, связь между количеством зарегистрированных больных алкоголизмом и количеством совершенных преступлений прямая и довольно сильная (т.к. значение коэффициента r=0,9177 близко к 1). Квадрат коэффициента корреляции называется коэффициентом детерминации (R2) и показывает долю вариации результативного признака, объясненную вариацией факторного признака. В данной задаче R2 = 0,8421, т. е. 84,21 % вариации результативного признака (количество совершенных преступлений) объясняется вариацией факторного признака (количеством зарегистрированных больных алкоголизмом) [1].
Полученный коэффициент корреляции (рисунок 4б), подтверждает вывод, сделанный в пункте 1, связь между количеством беженцев и вынужденных переселенцев в РФ и количеством совершенных преступлений прямая и довольно сильная (т. к. значение коэффициента r=0,91 близко к 1). Соответственно коэффициент детерминации R2 = 0,82857, т. е. порядка 83 % вариации результативного признака (количество совершенных преступлений) объясняется вариацией факторного признака (количеством беженцев и вынужденных переселенцев) [1].
4. Оценка значимости коэффициента регрессии и уравнения регрессии в целом. Проверка статистической значимости коэффициента регрессии проверяется с помощью t-критерия Стьюдента. Для этого необходимо сформулировать гипотезы: H0: β=0 (линейной зависимости нет) и H1: β0 (линейная зависимость есть). Для определения фактическое значение t-критерия: использовались следующие формулы (7) [3]:
, где , (7).
Таким образом, было получено расчетное значение Тнабл = 2,59551 (рисунок 4а) и из таблиц критерия Стьюдента — табличное значение tтабл.(α=0,05, к=6)=2,4460. Так как, Тнабл> tтабл, то следовательно с вероятностью 95 % можно принять альтернативную гипотезу о статистической значимости коэффцициенты регрессии.
Оценка статистической значимости построенной модели регрессии в целом производится с помощью F-критерия Фишера. Для этого необходимо сформулировать гипотезы: H0: R2=0 и H1: R20. Определение фактического значения F-критерия осуществляется в соответствии с формулой (8): (8) [3]. Далее необходимо сравнить расчетные значения F-критерия Фишера и табличные: Fнабл = 42,6596 и Fнабл =38,6665, Fтабл(α=0,05,k1=1,k2=6) =5,99. Так как и в первом и во втором случае Fнабл>Fтабл, построенная моделт регрессии в целом значима и может быть использована для построения прогнозных моделей более высокого уровня [1].
Таким образом, в данной работе описан метод решения задачи о регрессионном анализе зависимости количества совершенных преступлений двух факторов количеств зарегистрированных болных алкоголизмом и количества беженцев и вынужденных переселенцев в Россию. Предложенная форма в табличном процессоре MS Excel позволяет использовать данный дагоритм решения пободной задачи всех пользоватеей. Следовательно, при необходимости можно изменить исходные данные в таблицуе MS Excel и система сама проведет все необходимые расчеты и сделает базовые выводы о корреляции между признаками.
Список литературы:
1.Богатов Д.Ф., Богатов Ф.Г. Конспект лекций и практикум по математике для юристов: Учебное пособие для образовательных учреждений юридического профиля. М.: «Приор-издат», 2003. — 448 с.
2.Данные федеральной службы государственной статистики: [Электронный ресурс] — Режим доступа. — URL: http://www.gks.ru/
3.Кремер Н.Ш., Путко Б.А. Эконометрика: учебник. М.:Юнити-Дана, 2010 г. — 328 с.
4.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: учеб. 8-е изд., исправленное. М: ДЕЛО, 2007 — 504 с.
5.Полянский Ю., Вепрев С., Лушников М. Эконометрика. Решение задач с использованием электронных таблиц Microsoft Excel. Практикум. М: Академия экономической безопасности МВД России, 2005 г. — 146 с.
дипломов
Оставить комментарий