Статья опубликована в рамках: Научного журнала «Студенческий» № 3(257)

Рубрика журнала: Экономика

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5

Библиографическое описание:

Лазаренко А.С. МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ: МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ И ФИНАНСОВЫХ ПРОЦЕССОВ // Студенческий: электрон. научн. журн. 2024. № 3(257). URL: https://sibac.info/journal/student/257/317182 (дата обращения: 10.02.2025).

МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ: МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ И ФИНАНСОВЫХ ПРОЦЕССОВ

Лазаренко Александра Сергеевна

студент, факультет управления процессами перевозок, Уральский государственный университет путей сообщения;

РФ, г. Екатеринбург

Конышева Екатерина Владиславовна

научный руководитель,

канд. экон. наук, доц., кафедра «Экономика транспорта», Уральский государственный университет путей сообщения;

РФ, г. Екатеринбург

АННОТАЦИЯ

В статье рассмотрены методы машинного обучения в моделировании экономических и финансовых процессов. Основное внимание уделяется выбору и подготовке данных, обучению и оценке качества модели, а также прогнозированию и анализу результатов.

Ключевые слова: экономические и финансовые процессы, методы машинного обучения, анализ рисков, оценка эффективности, ограничения, большие объемы данных, нелинейность, временная динамика, прогнозы, данные, выбор данных, подготовка данных.

Введение

В настоящее время цифровые технологии играют важную роль в различных сферах деятельности человека. Это связано с тем, что цифровые технологии и алгоритмы машинного обучения предоставляют новые возможности для анализа и прогнозирования сложных экономических и финансовых данных.

Применение методов машинного обучения в моделировании экономических и финансовых процессов имеет огромное значение для принятия обоснованных решений в сфере бизнеса и инвестиций. В современном мире объемы данных растут с каждым днем, и традиционные эконометрические модели сталкиваются с ограничениями работы с большими объемами информации. Однако они имеют свои ограничения, такие как затруднительная работа с большими объемами данных, нелинейность связей и неполный учет временной динамики. В последние годы методы машинного обучения стали активно применяться в экономическом и финансовом анализе для устранения указанных выше ограничений и получения более точных и верных прогнозов.

Целью нашего исследования является определение проблем в сфере моделирования экономических и финансовых процессов, применение методов машинного обучения.

Основная часть

Моделирование экономических и финансовых процессов является трудоемкой задачей, связанной с прогнозированием и анализом поведения рынков, цен на активы, инфляции, процентных ставок и прочих факторов, воздействующих на экономику и финансовую сферу. Одной из ключевых проблем моделирования является неопределенность и сложность экономических и финансовых процессов. Экономика и финансы подвержены влиянию множества факторов, которые могут быть сложными для учета в моделях.

Кроме того, экономические и финансовые процессы часто характеризуются высокой степенью нестабильности и изменчивости. Рынки могут быть подвержены резким колебаниям цен, волатильности и другим непредсказуемым факторам. Это создает сложности при разработке моделей, которые должны быть способны адаптироваться к изменяющимся условиям.

Еще одной проблемой является ограниченность доступных данных. В экономике и финансах может быть сложно получить достаточное количество данных для построения надежных моделей. Кроме того, данные могут быть неполными или содержать ошибки, что может привести к неточным результатам.

Все эти трудности делают моделирование экономических и финансовых процессов сложным и вызывают необходимость в использовании более сложных и гибких методов, таких как методы машинного обучения.

Машинное обучение - это подраздел искусственного интеллекта, который позволяет компьютерным системам обучаться на основе данных и опыта, без явного программирования. Оно использует алгоритмы, которые автоматически анализируют данные, находят закономерности и делают предсказания.

Выбор и подготовка данных

Один из первоначальных шагов в моделировании экономических и финансовых процессов при применении методов машинного обучения - это выбор и подготовка данных. Для обучения моделей требуются данные, которые содержат информацию о различных показателях экономики, финансовых инструментах, рыночных трендах и других важных переменных. При выборе данных необходимо определить, какие переменные и источники данных являются значимыми для моделирования экономических и финансовых процессов. Это может включать, например, макроэкономические показатели (ВВП, инфляция, безработица и т.д.), финансовые инструменты (акции, облигации, валюты) или данные рынка (цены, объемы торгов и т.п.).

После выбора соответствующих переменных необходимо провести исследование источников данных и собрать необходимую информацию. Источники данных могут включать базы данных государственных организаций, финансовые платформы, биржи, статистические агентства или специализированные финансовые базы данных. Очень важно учитывать достоверность и актуальность собранных данных.

По прошествию этапа сбора данных следует выполнить их очистку. Этот шаг включает проверку данных на наличие выбросов, пропусков или аномалий. Необработанные данные могут содержать ошибки, неточности или неполные записи. Очень важно исключить или заменить выбросы, заполнить пропущенные значения и обработать аномальные записи. Для этого можно использовать различные методы статистической обработки данных, фильтрации или даже привлечение экспертных знаний.

После очистки данных рекомендуется провести предварительный анализ, дабы оценить распределение переменных, а также взаимосвязь между ними и просмотреть статистические характеристики данных. Для этого можно построить графики, диаграммы рассеяния и расчет статистических показателей, таких как среднее, медиана, стандартное отклонение и корреляция. Ввиду этого анализа, можно понять свойства данных, их структуру и подготовить их к дальнейшей обработке-моделированию.

Абсолютно весь процесс выбора и подготовки данных является крайне важной предварительной работой перед построением моделей машинного обучения. Он направлен на обеспечение качественных и достоверных данных для обучения модели и на получение более точных результатов в конечном итоге.

Методы машинного обучения

Область экономики и финансов предлагает широкий спектр моделей машинного обучения. Рассмотрим некоторые из них и их применение в различных задачах:

Линейная регрессия: это статистический метод, используемый для предсказания численных значений зависимой переменной на основе набора независимых переменных. В экономике линейная регрессия может быть полезной при моделировании взаимосвязей между экономическими показателями, такими как ВВП, и факторами, такими как инвестиции и потребление. Путем анализа исторических данных по этим переменным, линейная регрессия может помочь в прогнозировании будущих значений ВВП на основе изменений в инвестициях, потреблении и других релевантных факторах. Это позволяет экономистам и аналитикам принимать дальновидные решения на основе этих прогнозов.
Логистическая регрессия: в задачах классификации используется логистическая регрессия для прогнозирования принадлежности объекта к определенному классу. Например, в сфере финансового анализа логистическая регрессия может быть применена для оценки вероятности дефолта клиента на основе его финансовых показателей. Этот метод позволяет строить модель, учитывающую влияние независимых переменных на вероятность наступления дефолта. Таким образом, логистическая регрессия является полезным инструментом для финансовых учреждений, позволяющим прогнозировать риски и принимать осознанные решения на основе вероятностной информации.
Деревья решений: Модели деревьев решений для оценки кредитного риска анализируют различные финансовые показатели заемщика, такие как доходы, задолженности и кредитная история. На основе этих данных модель дерева решений может предсказать вероятность невозврата кредита. Для прогнозирования рыночных трендов деревья решений могут использоваться с учетом различных факторов, включая финансовые показатели и новости, которые могут оказывать влияние на рыночные условия. Анализируя эти данные, модель дерева решений позволяет выявить взаимосвязи и предсказать будущие тренды на рынке.
Случайный лес: это алгоритм машинного обучения, который состоит из набора деревьев решений. Путем комбинирования прогнозов отдельных деревьев случайный лес позволяет повысить точность прогнозирования. В экономике и финансах случайный лес может быть успешно применен в различных задачах, таких как прогнозирование торговых стратегий, определение оптимального портфеля или оценка риска инвестиций.
Метод опорных векторов (SVM): является универсальным алгоритмом, который широко используется для решения задач классификации и регрессии. Он также может быть применен в финансовой аналитике для прогнозирования направления движения цен на финансовых рынках или для классификации ценных бумаг на основе определенных факторов.
Кластерный анализ: Группировка объектов, основанная на их сходстве - это главный принцип кластерного анализа. В областях экономики и финансов данный метод может быть применен для разбиения рынков на сегменты, выявления потребительских групп или определения оптимальной стратегии ценообразования.
Нейронные сети: Инспирированные функционированием человеческого мозга, модели нейронных сетей обладают великой гибкостью и способностью эффективно обрабатывать информацию. В области экономики и финансов нейронные сети находят широкое применение в задачах прогнозирования временных рядов, анализа текстов, выявления эмоциональной окраски или создания автоматизированных торговых стратегий.

Обучение модели

В процессе обучения моделей в машинном обучении существуют несколько приоритетных методов, что позволяют настроить модель и оценить ее качество. Для начала дается задача - разделить исходный набор данных на две части: обучающую и тестовую выборки. Обучающая выборка используется для обучения модели, в то время как тестовая выборка служит для оценки качества работы обученной модели на новых, ранее неизвестных данных. Процесс разделения данных позволяет оценить способность модели к обобщению на новые данные и выявить ее эффективность. Далее - Кроссвалидация - это метод, который позволяет более точно оценить качество модели. Вместо простого разделения данных на обучающую и тестовую выборки, данные разбиваются на несколько частей, называемых "фолдами".

Затем модель обучается на одном фолде и оценивается на других фолдах. Процедура повторяется несколько раз, и результаты оценки модели на всех фолдах усредняются. Такая многократная проверка позволяет получить еще более надежную оценку качества модели, а также учесть ее способность к обобщению на различные наборы данных.

Выбор оптимальных гиперпараметров является следующим и точно таким же важным этапом обучения модели. Каждая модель имеет набор гиперпараметров, которые нужно настроить для достижения наилучших результатов. Гиперпараметры могут включать в себя такие параметры, как глубина дерева решений, коэффициент регуляризации и другие, которые влияют на сложность модели.

Для выбора оптимальных гиперпараметров обычно используются методы поиска по сетке или случайный поиск. В методе поиска по сетке перебираются различные комбинации гиперпараметров на обучающей выборке, а затем выбирается комбинация, которая показывает наилучшее качество модели. С другой стороны, при использовании случайного поиска гиперпараметры выбираются случайным образом, и модель оценивается на основе каждой комбинации. Это позволяет охватить более широкий диапазон возможных значений гиперпараметров и найти наилучшую комбинацию.

Оценка качества модели

Оценка качества модели является важным шагом в анализе и выборе модели. Она позволяет оценить, насколько хорошо модель выполняет поставленную задачу. Для оценки качества модели применяются различные метрики, которые позволяют измерить точность, полноту и другие характеристики ее работы.

В задачах регрессии часто используются метрики, такие как:

средняя абсолютная ошибка (MAE);
среднеквадратичная ошибка (MSE);
коэффициент детерминации (R^2)

Средняя абсолютная ошибка измеряет среднее отклонение предсказанных значений от фактических, а среднеквадратичная ошибка обращает большее внимание на большие отклонения. Коэффициент детерминации показывает, насколько модель объясняет дисперсию целевой переменной.

В задачах классификации распространены метрики, такие как:

точность (accuracy);
полнота (recall);
точность (precision) и F1-мера

Точность измеряет долю правильно классифицированных объектов, полнота показывает, какую долю объектов из положительного класса модель правильно обнаружила, а точность измеряет долю правильно классифицированных объектов из всех, которые модель отнесла к положительному классу. F1-мера является гармоническим средним между точностью и полнотой и используется для их объединенной оценки.

Оценка качества модели является очень важным этапом, который позволяет выбрать наилучшую модель для решения задачи. В зависимости от конкретной задачи и особенностей данных, могут применяться различные метрики для оценки качества моделей.

Прогнозирование и анализ результатов

Процесс прогнозирования с использованием обученных моделей включает несколько этапов. Сначала, данные, на которых модель не была обучена, передаются модели на вход. Затем модель использует свои знания и основанные на них алгоритмы для создания прогнозов. В зависимости от поставленной задачи, прогнозы могут быть числовыми (в случае регрессии) или категориальными (в случае классификации).

Оценка точности прогнозов является ключевым этапом процесса прогнозирования. Она позволяет определить, насколько точно модель предсказывает реальные значения или категории. Для этого используются различные метрики, которые вычисляются путем сравнения прогнозов модели с истинными значениями.

Обнаружение выбросов также является важной задачей в анализе результатов прогнозирования. Выбросы представляют собой значения, которые существенно отличаются от остальных данных и могут искажать результаты. Для обнаружения выбросов в данных можно использовать различные методы, такие как статистические тесты, интерквантильный размах или методы машинного обучения, например, алгоритмы кластеризации. Если выбросы обнаружены, их можно исключить из анализа или подвергнуть дополнительной обработке.

Анализ результатов прогнозирования может также включать визуализацию данных и прогнозов, анализ важности признаков, изучение временных или пространственных зависимостей и другие подобные шаги. Целью анализа результатов является получение дополнительных уникальных знаний, понимание причинно-следственных связей и улучшение процесса прогнозирования.

Так, прогнозирование и анализ результатов - это последовательный процесс, включающий обучение модели, создание прогнозов, оценку и анализ точности полученных результатов. Важную роль для достижения достоверных прогнозов и высококачественных аналитических выводов играют критическое мышление, экспертное знание и использование соответствующих инструментов и методов.

Заключение

Методы машинного обучения широко применяются для решения экономических и финансовых задач. Они обладают способностью анализировать большие объемы данных, выявлять скрытые закономерности и предсказывать будущие тренды. Применение этих методов в финансовой сфере позволяет улучшить точность прогнозов, оптимизировать процессы принятия решений и снизить риски.

Однако, стоит учитывать, что машинное обучение не является универсальным решением для всех финансовых проблем. Его применение требует осторожного подхода и выбора подходящих моделей, а также наличия качественных данных для обучения. Кроме того, следует помнить о возможных ограничениях и ошибкам, связанным с прогнозированием и принятием решений на основе алгоритмов машинного обучения. Будущее финансового сектора неразрывно связано с развитием и применением методов машинного обучения, и важно быть в курсе последних тенденций и применять их на практике.

Список литературы:

Конышева Е.В. Стратегическое управление устойчивым развитием организации на основе функционального и процессно-ориентированного подходов // Экономика и предпринимательство. – 2017. – № 10-2(87). – С. 644-647.
Коротеев М. В. Обзор некоторых современных тенденций в технологии машинного обучения // E-Managment. – 2018. – Т. 1, № 1. – С. 26–35. – DOI: 10.26425/2658-3445-2018-1-26-35
Опенков М. Ю., Варакин В. С. Искусственный интеллект как экономическая категория // Вестник Северного (Арктического) федерального университета. – 2018. – № 1. – С. 73–83.
Соколова И. С., Гальдин А. А. Практическое применение искусственного интеллекта в условиях цифровой экономики // Модели, системы, сети в экономике, технике, природе и обществе. – 2018. – № 2 (26). – С. 71–79
Ходачек И. А. и др. Применение машинного обучения для типологизации финансовых моделей университетов //Высшее образование в России. – 2023. – Т. 32. – №. 11. – С. 116-135.
Кирилюк И. Л. Модельные риски в финансовой сфере в условиях использования искусственного интеллекта и машинного обучения//Russian Journal of Economics and Law. – 2022. – Т. 16. – №. 1. – С. 40- 50.
Аханевич Д. Ю. Исследование подходов и методов применения искусственного интеллекта и машинного обучения в социально- экономических процессах //Вестник Омского университета. Серия «Экономика». – 2020. – №. 2. – С. 65-79.
Казаков О. Д., Азаренко Н. Ю. Комбинирование методов машинного обучения и имитационного моделирования социально-экономических процессов в системах поддержки принятия решений //Вестник Рязанского государственного радиотехнического университета. – 2020. – №. 71. – С. 97-107.

МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ: МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ И ФИНАНСОВЫХ ПРОЦЕССОВ

Оставить комментарий