Статья опубликована в рамках: III Международной научно-практической конференции «Физико-математические науки и информационные технологии: проблемы и тенденции развития» (Россия, г. Новосибирск, 11 июня 2012 г.)
Наука: Математика
Секция: Теория вероятностей и математическая статистика
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
дипломов
Этапы статистического исследования зависимостей, ориентированные на конкретные цели
Шепель Вячеслав Николаевич
д-р экон. наук, профессор ФГБОУ ВПО ОГУ, г. Оренбург
Акимов Сергей Сергеевич
аспирант факультета информационных технологий, ФГБОУ ВПО ОГУ, г. Оренбург
e-mail: elite17@yandex.ru
Одной из главнейших задач статистики на сегодняшний день - как на основании частных результатов статистического наблюдения за анализируемыми событиями или показателями выявить и описать существующие между ними взаимосвязи. Эта проблема - проблема статистического исследования зависимостей – одно из ключевых понятий современной статистики. Самое частое определение, которое предлагают различные пособия по статистике, звучит как: «Зависимость статистическая – это взаимосвязь двух признаков или величин» [3, с. 384].
Данное определение имеет свои погрешности, не совсем полностью охватывает термин «зависимость». Легко привести примеры зависимости, когда во взаимной увязке оказываются не два, и не три, а четыре, и более показателей.
Таким образом, мы можем предложить свое, более точное определение зависимости, как взаимосвязи двух или более признаков или величин.
Сам процесс исследования зависимостей в статистике очень сильно распылен между различными подходами. Зависимости изучаются, главным образом, с помощью корреляционно-регрессионного, факторного анализа, а также индексного метода. Данную проблематику исследовал целый ряд зарубежных ученых, достаточно вспомнить Г. Пааше, Э. Ласпейреса или Фишера.
Из отечественных ученых хочется выделить таких, как Чернов, Лабутин, Степанов, Саркисян, Мхитарян и, особенно Айвазян.
С.А. Айвазян выделяет семь основных этапов в процессе статистического исследования зависимостей [1, с. 24].
Остановимся на целях исследования. Как правило, выделяют три основных цели исследования:
·установление самого факта наличия (или отсутствия) статистически значимой связи между Y и X;
·прогноз (восстановление) интересующих нас индивидуальных Y или средних значений Yср исследуемых результирующих показателей по заданным значениям Х соответствующих объясняющих переменных;
·выявление причинных связей между объясняющими переменными Х и результирующими показателями Y, частичное управление значениями Y путем регулирования величин объясняющих переменных Х [2, с. 47].
Рассмотрим этапы, выделяемые Айвазяном во взаимосвязи с целями исследования. Данная постановка вопроса – определение этапов исследования зависимостей во взаимосвязи с целями исследования уже не раз поднималась многими авторами.
Для начала зададимся первой конечной целью исследования – установим сам факт наличия или отсутствия статистически значимой связи между Y и X.
Первый этап (по Айвазяну)) – это постановочный этап, на котором определяются элементарные единицы статистического исследования (или элементарный объект исследования), набор показателей, с обязательным разделением их на «входные» и «выходные», совокупность элементарных объектов исследования, и т. д. Данный этап, разумеется, будет присутствовать при первой конечной цели статистического исследования, и, более того, он будет справедлив вне зависимости от конечной цели исследования.
Второй этап – информационный. Он подразумевает проведение сбора необходимой статистической информации, что дает (в зависимости от ситуации) условия активного или пассивного эксперимента, и в итоге, при завершении второго этапа исследователь располагает исходными статистическими данными.
Данный этап также справедлив для всех типов конечной прикладной цели исследования.
Третий этап – корреляционный анализ. Как мы знаем, корреляционный анализ – это совокупность методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. Главной целью корреляционного анализа является получение некоторой информации об одной переменной с помощью другой переменной, или, проще говоря, нахождение связи между двумя переменными, то есть частный случай общей задачи исследования зависимостей. Результатом корреляционного анализа является получение коэффициента (коэффициентов) корреляции, который (которые) определяют тесноту (силу) связи между переменными.
Завершение данного этапа дает исследователю ответ на первоначальный вопрос (конечную цель) – есть ли связь между переменными, и какова их теснота, то есть можно ли говорить о статистически значимой связи между Y и X.
Поскольку в понятие корреляционного анализа входит не только вычисление основных параметров корреляционной зависимости по формулам, но и оценка их достоверности, то можно говорить о том, что с завершением данного этапа выполняется конечная цель исследования, а значит, на третьем этапе для первого типа прикладной цели исследование завершается [6, с. 56].
Перейдем ко второй цели.
Согласно С.А. Айвазяну, второй тип конечной прикладной цели исследования – это «…прогноз (восстановление) неизвестных значений интересующих нас неизвестных индивидуальных Y или средних Yср значений исследуемых результирующих показателей по заданным значениям Х соответствующих объясняющих переменных» [2, с. 49].
То есть если у исследователя возникла необходимость продолжить заданный числовой ряд, то каким образом это выполнить по имеющимся данным?
Как уже рассматривалось выше, первый этап (постановочный) и второй (информационный) имеет место для любого исследования вне зависимости от конечной прикладной цели. То же самое касается и третьего этапа – корреляционного анализа, как мощной математической основы решения задач по исследованию зависимостей.
Перейдем к четвертому этапу – определению класса допустимых решений (параметризации модели). Как известно, главной целью исследователя на этом этапе является определение общего вида, структуры искомой связи между Y и Х. По завершению этого этапа исследователь будет располагать некоторой функцией (а, чаще, целым классом функций определенного вида), которая будет способна описать имеющуюся зависимость математическим языком.
Для того чтобы спрогнозировать, или восстановить неизвестные индивидуальные или средние значения результативных переменных, недостаточно только выделить класс функций. Ведь по завершению четвертого этапа исследователю еще неизвестны конкретные числовые значения параметров – коэффициентов найденной функции. Поэтому имеется необходимость продолжать поэтапное достижение конечной прикладной цели.
Пятый этап – анализ мультиколлинеарности предсказывающих переменных и отбор наиболее информативных из них. Как известно, мультиколлинеарность – это тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат. Эта связь затрудняет оценивание параметров регрессии в частности, при анализе эконометрической модели [5, с. 241]. Поэтому, для реализации данного этапа, перед исследователем стоит задача устранения (или сведения к минимуму) влияния мультиколлинеарности.
Рассмотрим шестой этап – вычисление оценок неизвестных параметров, входящих в исследуемое уравнение статистической связи. То есть, зная тип функциональной зависимости, исследователь находит такие числовые коэффициенты, которые бы удовлетворяли уравнение функции при заданных значениях Х и Y. Таким образом, по завершению шестого этапа исследователь получает уравнение регрессии.
Несмотря на то, что цель достигнута, необходимо добавить еще один этап – анализ точности полученных уравнений связи. Дело в том, что полученная на четвертом этапе функция не строго, а лишь приближенно описывает характер взаимосвязи, так как имеет место не функциональная, а корреляционная зависимость. Анализ точности исследуемых регрессионных моделей достаточно хорошо изучен и оснащен необходимым математическим аппаратом.
По завершению рассмотрения второй прикладной цели, имеет смысл рассмотрение последней, третьей конечной прикладной цели, которая звучит как выявление причинных связей между объясняющими (входными) переменными Х и результирующими (выходными) показателями Y, частичное управление значениями Y путем регулирования величин объясняющих переменных Х.
Для начала рассмотрим уже пройденные этапы. Безусловно, для реализации данной цели важны не только постановочный и информационный этапы. Для выявления связи и управления переменными необходим также корреляционный (этап 3) и регрессионный анализы (этапы 4—7). В некотором смысле, по завершению седьмого этапа решается и поставленная цель, поскольку на руках у исследователя оказывается уравнение зависимости (пусть и не функциональной, но корреляционной), что, во-первых, обуславливает связь между объясняющими и результативными переменными, а, во-вторых, позволяет частично регулировать результативные переменные, подставляя некоторые значения объясняющих переменных (используя, например, метод перебора). Однако здесь следует отметить, что терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения [4, с. 3].
Потому имеет смысл выделить еще один – восьмой – этап, который озаглавим как «механизм выявления причинно-следственной связи». Несмотря на то, что большинство исследователей ставят перед собой именно третью цель, ее реализация остается весьма проблематичной, поскольку такая постановка задачи подразумевает исследование самого механизма преобразования объясняющих переменных Х в результирующие переменные Y, что далеко не всегда удается сделать.
Проведенное выше описание этапов во взаимосвязи с целями позволяет исследователю искать решение не по универсальной схеме, находя, зачастую, неиспользуемые в дальнейшем параметры, а сразу определить для себя необходимый круг задач, исходя из целей исследования.
Список литературы:
1.Айвазян С.А. Прикладная статистика: Исследование зависимостей. Справочное издание, 1985. – 487 с.
2.Айвазян С.А., Мхитарян В.С. Прикладная статистика. Основы эконометрики. Теория вероятностей и прикладная статистика – М.: Юнити-Дана, 2007. – 656 с.
3.Большой Энциклопедический Словарь / под ред. С.М. Снарской, Рипол-Классик / Норинт, 2006. – 2144 с.
4.Буляница А.Л., Курочкин В.Е., Кноп И.С. Методы статистической обработки экологической информации: дискриминантный, корреляционный и регрессионный анализ. Учеб пособие. СПбГУАП. - СПб.: РАН. Ин-т аналитич. приб-я, 2005. – 48 с.
5.Лопатников Л.И. Экономико-математический словарь. Словарь современной экономической науки.– М.: Дело, 2003. – 520 с.
6.Сошникова Л.А. Многомерный статистический анализ в экономике. Учеб. пособ. для вузов / Под ред. проф. В.Н. Тамашевича. М.: Юнити, 1999. – 138 с.
дипломов
Оставить комментарий