Статья опубликована в рамках: XCIV Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 04 июня 2020 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
ИСПОЛЬЗОВАНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО РАСПОЗНАВАНИЯ ОБРАЗОВ ПРИ ДИАГНОСТИРОВАНИИ СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ
USE OF METHODS OF STATISTICAL RECOGNITION OF PATTERNS DIAGNOSTIC CARDIOVASCULAR DISEASES
Anna E. Asanova
master student, Department of Applied Information Technologies, Kuzbass State Technical University named after T.F. Gorbachev
Russia, Kemerovo
АННОТАЦИЯ
Медицина остается наукой, оперирующей большими массивами данных. В статье производится краткий обзор различных статистических методов для решения задач прогнозирования. А также рассмотрение возможности их применения в диагностике сердечно-сосудистых заболеваний.
ABSTRACT
Medicine remains the science of operating with large amounts of data. The article provides a brief overview of various statistical methods for solving forecasting problems. As well as considering the possibility of their use in the diagnosis of cardiovascular diseases.
Ключевые слова: методы распознавания образов, статистические методы, заболевания сердечно-сосудистой системы.
Keywords: pattern recognition methods, statistical methods, diseases of the cardiovascular system.
Развитие информационных технологий позволило решить ряд задач, связанных с процессами жизнедеятельности человека, облегчить и ускорить процесс их решения и повысить качество результата. Одно из актуальных направлений исследования – задачи диагностики и прогнозирования некоторой величины Y по доступным значениям переменных X1, . . . , Xn.
Существует множество методов принятия решения от математического моделирования до применения нейронных сетей. Иногда прогнозирование Y может сводиться к определению её к одному из ранее известных классов. Задачи, в которых прогнозируемая величина принимает значения из множества, содержащего относительно небольшое число элементов, принято называть задачей распознавания. Они позволяют решать не только задачу прогноза, но и классификации, управления процессами или системами. Как правило принятие решений для таких задач производит специалист. Но с увеличением сложности систем и процессов в них, учитывая большое количество взаимосвязанных данных, которые необходимо принимать во внимание, возникают проблемы повышения качества правильности принимаемых решений.
В общем виде задача распознавания образа сводится к определению правил для отнесения объекта к определенной группе (категории или классам) на основе изучения его характеристик. Выделим основные понятия:
- Признак - Количественное или качественное описания свойства исследуемого объекта;
- Объект - Предмет или явление, исследуемое в задаче;
- Класс - Некоторое множество объектов, объединённое общими свойствами или свойством;
- Решающее правило распознавания - алгоритм, по которому методом обучения анализа значений признаков объекта будет определятся к какому классу (классам) он принадлежит;
- Обучение распознаванию образов - процесс, результатом которого является решающее правило распознавания, позволяющее осуществить распознавание с минимальной ошибкой прогноза.
Несмотря на разнообразие существующих подходов и методов к распознаванию образов, на текущий момент не существует универсального алгоритма, позволяющего решить задачу классификации объектов. Проведем обзор нескольких подходов и методов к решению такого типа задач.
Математический подход. В его основу положены правила, которые формулируются и выводятся в рамках определенного математического формализма. Условно их можно разделить на детерминистские и статистические.
Эвристический подход. Основывается на попытке моделирования опыта человека. Представляет собой набор процедур и основывается на математических методах. При их разработке важно учитывать опыт специалистов именно той области, для которой строится дисциплина.
Статистический подход. Основывается на математических правилах классификации объектов, которые формулируются в терминах математической статистики и базируются на статистических свойствах классов.
С развитием компьютерных технологий, человек стал внедрять их в свою повседневную жизнь. Особенное применение они нашли в медицине. В Российской Федерации болезни сердечно-сосудистой системы занимают ведущее место в структуре заболеваний, определяющих уровень временной и стойкой утраты трудоспособности и смертности населения. По данным Федеральной службы государственной статистики на 2016 год приходилось 4649 тыс. человек с болезнями кровообращения, по сравнению с 2013 годом этот показатель увеличился почти в 2 раза. Растущие показатели могут быть связаны с поздней диагностикой заболевания, отсутствием времени, денег или желания человека проходить длительные обследования и сдачу анализа.
При постановке диагноза врач, основывается на личном опыте и знаниях, а также информации доступной ему из книг, статей и интернета. По сути доктор на основе известных ему факторов (анализы пациента и его данные о его образе жизни) пытается классифицировать его нынешнее состояние.
С применением ЭВМ можно автоматизировать этот процесс. В роли объекта выступает болезнь, которую врач пытается определить у пациента. Признаками, в данном случае, будут как раз анализы человека и различные данные о его образе жизни. Ориентируясь на исследования влияния факторов влияющих на возникновение болезней сердечно-сосудистой системы можно выделить следующие важные параметры для диагностирования заболевания:
- Пол;
- Уровень образования;
- Дополнительные диагнозы;
- Употребление медикаментов;
- Употребление табака;
- Употребление алкоголя;
- Физические характеристики;
- Географические характеристики пациента;
- Семейное положение;
- Ежедневная диета;
- Физические нагрузки
- Индекс здоровья;
- Различные медицинские показатели.
На основании этих и многих других признаков должна производится классификация. Далее производится обучение системы, с целью минимизации её ошибки. Обучая систему, мы повышаем её точность в отнесении объекта к определенному классу. Процедура состоит из двух этапов:
- Формирование обучающей выборки;
- Определение границ классов для объектов обучающей выборки (например, путем ее разбиения на кластеры).
На этапе принятия решения, производится определение численной оценки, которая характеризует степень уверенности в отнесении системой объекта к одному из заранее известных классов. Оценки определяются на основе описания объекта и данных о границах сформированных кластеров. Минимизация происходит за счет изменения некоторого порогового значения, по которому и определяется принадлежность к классу. Обучение производится до тех пор, пока ошибка не станет приемлемой. Стоит обратить внимание, что при создании прикладных программ, ориентированных на решение задач медицинской диагностики, важен механизм хранения входной и выходной информации. Это необходимо для накопления базы, что позволит не только улучшать диагностические системы, но и повышать эффективность лечения.
С учетом масштабов проблемы сердечно-сосудистых заболеваний современная медицина, нуждается в вооружении недорогими, безопасными для пациента, эффективными и надежными прикладными инструментальными средствами.
Список литературы:
- Вапник В.Н. Задача обучения распознаванию образов. – М.: Знание, 1971. – 64 с.
- Жариков О.Г., Ковалев В.А., Литвин А.А Современные возможности использования некоторых экспертных систем в медицине // Врач и информационные технологии. - 2008. - №5. - С. 24-30.
- Федеральная служба государственной статистики URL: http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/publications/catalog/doc_1139919134734 (дата обращения: 25.05.2020).
дипломов
Оставить комментарий