Статья опубликована в рамках: XLVIII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 26 декабря 2016 г.)

Наука: Математика

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Сычева А.П. РАЦИОНАЛЬНОЕ ИСПОЛЬЗОВАНИЕ В УПРАВЛЕНИИ СТАТИСТИЧЕСКИХ РЕСУРСОВ КАК ЗАДАЧА РАСПОЗНАВАНИЯ ОБРАЗОВ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. XLVIII междунар. студ. науч.-практ. конф. № 11(47). URL: https://sibac.info/archive/technic/11(47).pdf (дата обращения: 20.03.2025)

Проголосовать за статью

Конференция завершена

Эта статья набрала 0 голосов

Дипломы участников

У данной статьи нет
дипломов

РАЦИОНАЛЬНОЕ ИСПОЛЬЗОВАНИЕ В УПРАВЛЕНИИ СТАТИСТИЧЕСКИХ РЕСУРСОВ КАК ЗАДАЧА РАСПОЗНАВАНИЯ ОБРАЗОВ

Сычева Анастасия Павловна

студент, Институт теоретической экономики и международных экономических отношений, Самарский государственный экономический университет, Самара

Данные, которые получают органы государственной статистики, достаточно велики и многообразны по своей форме. Одной из основных проблем, касающихся увеличения успешного использования ресурсов формации, управляя процессом становления территориальных систем экономики, является возможность выбирать самой эффективной математической для обработки и описания данных. Существующая статистическая информация это разнообразные временные ряды, но только некоторые из них могут быть успешно использованы в решении практических вопросов среди всеобщего потока данных. Необходимость выбирать для того, чтобы описывать объект специальных информативных систем признаков является индивидуальной задачей распознавания. Так, вопрос рационального использования информационных ресурсов в управлении рассматривают в качестве задачи распознавания образов. Ответом к решению данной задачи становится отображение пространства разнообразных признаков в пространство более маленького масштаба (например, рабочий словарь), всё это значительно облегчает и ускоряет процесс обработки данных.

Рассмотрим пример распознавания образов в общественных науках. Целью задачи является построение системы классификации государств для определения необходимости гуманитарной поддержки со стороны международных организаций. Необходимо выявить закономерности связей между различными, объективно измеряемыми параметрами, например, связь между ВНП, уровнем грамотности и уровнем детской смертности. Во многих задачах распознавания, ориентированных на практику, процесс определения полного набор разнообразных признаков, описывающим объект, становится по-настоящему сложным, а иногда и почти невозможным делом. Однако с другой точки зрения, немалый размер параметров, которые измеряют, способен “зашумлять” процесс распознавания объектов, а также увеличить время, которые тратится на то, чтобы провести саму процедуру идентификации.

Для того, чтобы выполнить последующие рассуждения необходимо задать ряд определений. Вектор Х = (х₁, х₂, …, х_n) это вектор параметров объекта, который получают в процессе непосредственных измерений (то есть статистические данные). Вектором признаков называют новый вектор У = (У₁, У₂, …, У_m), который представляет собой или ограниченный набор параметров, или вектор, который получают при некотором преобразовании параметров у_i = ф_i(Х). Априорный словарь признаков (АСП) – это множество разнообразных признаков и параметров, которые относятся к объекту. Рабочий словарь признаков – это множество признаков или (и) параметров информации (часть АСП), которое сформировано в ходе обучения для поиска ответов на вопросы идентификации.

Успешность данного признака можно определить размером пользы, которую приносит его вклад при распознавании. Для того, чтобы оценить пользу вклада используют энтропию, дивергенцию, прямую оценку вероятности совершения ошибки. При известности распределения вероятностей признаков, используют факторы энтропии и дивергенции. Если для каждого класса объектов распределение вероятностей признаков неизвестны, тогда нужно использовать критерии, которые базируются на непосредственной оценке вероятности ошибки распознавания. В данном случае от выбранного способа изменения пространства параметров Х в пространство признаков У зависит поиск экстремального значения заданного критерия эффективности признака.

Методы построения РСП и эвристические алгоритмы, существующие на данном этапе, для описания классифицируют по следующим группам: методы минимизации для системы, описывающей образы (объекты управления), когда РСП это подпространство У (размерности m) полного пространства признаков Х объекта экономики (размерности n), m<n; структурные методы описания образов, когда признаковое пространство У получается путем некоторого преобразования априорного пространства Х.

Способы уменьшения систем описания различных образов.

Данная группа методов включает: алгоритмы направленного перебора разнообразных подсистем параметров для того, чтобы выбрать наилучший с точки зрения заданного критерия; алгоритмы выбора информативных признаков на основе расстояния между параметрами различных классов; алгоритм случайного поиска с адаптацией (игровой алгоритм). Под минимизацией обычно понимается уменьшение числа измеряемых параметров. При этом либо заранее (из каких-либо физических соображений) определяется количество признаков n (n < m), либо n выбирают в зависимости от требуемой точности решения задачи, что определяется значимостью конкретного информационного ресурса экономической системы для принятия управленческих решений.

Если значения m и n достаточно малы, то выбор системы признаков Y из пространства параметров X можно осуществить путем полного перебора всех возможных комбинаций, равных числу сочетаний из m по т.

Для больших значений m и n применяются алгоритмы, не использующие полный перебор. Например алгоритм Мерилла и Грина (алгоритм последовательного исключения), суть которого — в поочередном исключении одного параметра, в отсутствие которого критерий принимает оптимальное значение.

Агоритм последовательного включения параметров, не использующий полный перебор, состоит в том, что система признаков формируется по принципу включения в нее наилучшего по заданному критерию информативности параметра. Алгоритмы выбора информативных признаков основываются на расстояниях между параметрами как внутри классов (однородных экономических объектов), так и между классами. При этом в качестве информативных признаков выбираются те параметры, расстояния между которыми внутри класса минимальны, а между классами максимальны. В основу алгоритма случайного поиска с адаптацией положено предположение о том, что признаки, входящие в наиболее информативную систему, чаще встречаются в тех системах, которые близки к ней по некоторому критерию информативности, и наоборот.

Структурные способы описания различных образов.

Структурные методы составляют: факторный анализ, в частности метод главных компонентов; нелинейное преобразование пространства параметров (многомерное масштабирование); аппроксимация параметров; МОС-метод — метод моделирования статистик, различающих случайные величины.

Основная идея факторного анализа состоит в том, чтобы, наблюдая большое число измеряемых параметров, выявить меньшее число таких признаков (факторов), которые в основном определяют поведение параметров и характеризуют исследуемый объект. Процесс нелинейного преобразования пространства параметров X в пространство признаков Y (меньшей размерности) называют еще многомерным масштабированием. Целью нелинейных отображений является изменение структуры расстояний между объектами с соблюдением ограничений, накладываемых структурой исходного распределения, и предоставление возможности наглядного анализа многомерных информационных ресурсов.

Алгоритмы нелинейного преобразования параметров можно разделить на две группы: первые осуществляют преобразование у, = ф,(Х) с одновременным понижением размерности признакового пространства (итеративный и неитеративный алгоритмы), вторые производят двумерное отображение.

К методу стохастической аппроксимации прибегают в том случае, когда наблюдаемые в выбранных точках Xj значения функции параметров f¡ = f(X) являются реализациями случайных величин 2. В качестве критерия эффективности берутся математические ожидания М,[2], i = 1, М.

Задача выделения признаков сводится к отысканию наилучшей аппроксимирующей функции // = // (X), минимизирующей критерий. Метод моделирования статистик, различающих случайные величины (МОС-метод), базируется на переходе от многомерных наборов признаков, описывающих экономические системы: Хк = (х^, хк2, ..., Хкп), к одномерным / = 1,т; к = 1,М, которые аккумулируются отличительными особенностями наблюдений.

Базой метода становится предположение, что различные объекты обладают разными наборами признаков, то есть это реализации разнообразных случайных величин. Следовательно, для каждой совокупности однородных объектов существуют свои характерные преобразования вида =<Р,(хМ^ x_k!:.•., ^> (2)/ = 1,т; к = 1,М, отражающие внутреннюю структуру объекта идентификации.

РСП идентичных объектов содержит характеристика, определенная специальным путем или выявленная в результате изучения.

В основу различия признаков типа (1) стоят отношения 20 = а / Ь, а также модули разности 2р = |а - Ь|, в которых за а и Ь берутся составляющие вектора (1). Функциональные преобразования (2), которые основываются на модулях разностей компонентов (1), называются характеристиками типа «расстояний». Изменения, которые были базированы на отношениях, называются характеристиками типа «отношений». Схемы, с помощью которых задаются характеристики типа «отношений» и «расстояний» создаются как суммы, минимумы и максимумы модулей разностей, а также отношений различных порядков компонентов вектора (1).

Процесс создания структуры РСП, базируясь на МОС-методе, основывается на следующих принципах: избыток признаков, которые описывают объект; одномерность признаков в РСП; «непересекаемость» распределений признаков, которые аккумулируют характерные черты различных объектов; минимальная вариабельность признака.

На практике, каждый из признаков формируют в качестве функции типа (2). Так происходит уход от множественности образов первоначальной совокупности ресурсов информации, позволяющее значительно облегчить ход решения вопроса их успешного использования, поскольку аналитика объемных наблюдений выполняется значительно тяжелее, чем одномерных.

В основе принципа «непересекаемости» лежит концепция того, что всегда можно найти такие преобразования <. (•); / = 1,т, что получаемые признаки будут обладать минимальной вариацией, а для различных объектов — еще и значительные различия в количестве. Структурные методы построения пространства признаков, существующие на данном этапе, тоже не каждый раз могут давать нужный результат. Классические способы анализа факторов нужны для того, чтобы решить различные статических вопросы, но бывает, что их используют и для сравнения «срезов» временных точек. Итеративный алгоритм в свою очередь может оказаться «вычислительным монстром».

Всё это дает возможность предложить МОС-метод в качестве инструментария для увеличения успешности пользования ресурсами информации статистики в процессе управления.

Список литературы

Белов Д.Б., Соловьев С.И. Определение значимости различий в результатах наблюдений объемов потребленного и поставленного ресурса статистическими методами//Известия Тульского государственного университета. Технические науки. – 2013. - №11
Лапко А.В., Лапко В.А., Саренков А.В. Гибридный алгоритм распознавания образов и его свойства//Вестник Сибирского государственного аэрокосмического университета им. Академика М.Ф. Решетнева. – 2009. - №2
Олейник О.С. Развитие и использование государственных статистических информационных ресурсов//Вестник Волгоградского государственного университета. Серия 3: Экономика. Экология. – 2008. - №.