Статья опубликована в рамках: CXXV Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 08 мая 2023 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
НЕЙРОСЕТЕВАЯ МОДЕЛЬ ПРЕДСКАЗАНИЯ ДИНАМИКИ КУРСА АКЦИЙ НА БИРЖЕ
NEURAL NETWORK MODEL FOR PREDICTING THE DYNAMICS OF STOCK PRICE
Anton Koshmarov
Student, Department of Automation of scientific research, Moscow state University,
Russia, Moscow
Alexei Shishkin
Scientific supervisor, Doctor of Physical and Mathematical Sciences, Moscow state University,
Russia, Moscow
АННОТАЦИЯ
В данной статье исследовалось применение методов машинного обучения, основанных на архитектурах LSTM и transformers, для прогнозирования динамики стоимости акций на основе исторических данных. Был проведен анализ различных наборов данных, включающих информацию о цене акций, объеме торгов и других характеристиках рынка, и проведено сравнение эффективности прогнозирования, полученных с помощью различных алгоритмов машинного обучения. Результаты исследования показали, что применение LSTM и transformers позволяет достичь высокой точности прогнозирования динамики стоимости акций, а также выявить важные факторы, влияющие на изменения цен на рынке.
ABSTRACT
This article investigated the use of machine learning methods based on ARM and transformers architectures to predict the dynamics of stock prices based on historical data. The analysis of various data sets, including information on the stock price, trading volume and other characteristics of the market, was carried out, and the effectiveness of forecasting obtained using various machine learning algorithms was compared. The results of the study showed that the use of LSTM and transformers makes it possible to achieve high accuracy in predicting the dynamics of stock prices, as well as to identify important factors affecting price changes in the market.
Ключевые слова: LSTM; Трансформеры; цена акций; node2vec.
Keywords: LSTM; Transformers; stock price; node2vec.
Введение.
В современном мире акции стали неотъемлемой частью экономической системы. Они представляют собой долю владения компанией и могут использоваться как инструмент для инвестирования капитала.
Формирование подходов в теории прогнозирования финансовых рынков происходило на протяжении долгого времени и связано с развитием экономической науки и финансовой теории. Среди основных подходов можно выделить: технический анализ, фундаментальны анализ и системы, построенные на основе методов машинного обучения (МО).
Среди методов МО можно выделить следующие:
- Модели, основанные на различных видах регрессии. В работе [1] были использованы методы множественной регрессии и методы нейронных сетей для прогнозирования стоимости акций компаний S&P 500. Исследователи пришли к выводу, что нейронные сети показали лучшие результаты по сравнению с методами множественной регрессии
- Модели использующие концепции временных рядов совместно с ARIMA, ARDL, VAR. В [2] авторы провели сравнительный анализ двух методов прогнозирования цен на акции: линейной регрессии и искусственных нейронных сетей.
Для линейной регрессии авторы использовали модель, основанную на множественной линейной регрессии. Для искусственных нейронных сетей была использована модель многослойного персептрона (MLP).
В результате исследования было установлено, что искусственные нейронные сети показали более высокую точность прогнозирования цен на акции, чем линейная регрессия. Авторы объясняют это тем, что искусственные нейронные сети могут обнаруживать более сложные зависимости между ценами акций и другими факторами, такими как объемы торгов и дневные изменения цен.
- Модели, основанные на глубоком обучении и обработки естественного языка. Одной из научных работ по этой теме является статья [3]. В данной работе авторы предлагают использовать глубокое обучение для предсказания стоимости акций, используя стековые автокодировщики (stacked autoencoders) и долгую краткосрочную память (LSTM).
Результаты экспериментов показали, что предложенный подход имеет высокую точность предсказания, превосходящую другие методы, такие как ARIMA, регрессия и SVM.
Авторы отмечают, что их модель не только точно предсказывает цены на акции, но и способна выявлять скрытые закономерности в данных и прогнозировать тенденции на рынке, что может быть полезно для принятия инвестиционных решений.
Таким образом, можно подвести итог, что первые две группы уступают моделям на основе LSTM и трансформеров, так как в них имеются некорректные допущения о линейности, о постоянстве параметров и не учитывается высокая степень шума, что может привести к неравномерности в исторических данных и как следствие неточности прогнозов.
Постановка задачи
Целью данной работы является построение нейросетевых моделей для предсказания динамики стоимости акций. Модели необходимо построить таким образом, чтобы они использовали преимущества современных нейросетевых архитектур, наиболее релевантных решаемой задаче. Таким образом, необходимо выполнить следующее:
- Выбор компаний из одного сектора. Обучение моделей предполагается на данных компаний, имеющих близкие направления деятельности. Такой выбор связан с тем, что компании в одном секторе экономики обычно имеют схожие характеристики, такие как цикличность, зависимость от определенных событий, риски и возможности. Эти характеристики важны для анализа и прогнозирования.
- Построение матрицы корреляции. Она помогает исследовать зависимости между различными компаниями.
- Формирование графа на основе матрицы корреляции (веса – значения корреляций)
- На основе полученного графа для каждой компании получение вектора характерных признаков с помощью Node2vec.
- Для каждой компании определение наиболее «похожих» компаний на основе вектора характерных признаков.
- Для каждой компании добавляются усредненные значения «похожих» компаний к исторической матрице.
- Полученная матрица подается на вход LSTM\Transformers.
Подготовка данных
В данной работе использованы данные из S&P 500 Healthcare Index [4], так как он включает в себя различные виды компаний, такие как производители лекарств, медицинское оборудование, здравоохранение, биотехнологии и другие. Среди компаний, входящих в этот индекс выбраны 20 наиболее значимых.
В качестве характерных признаков акций были взяты цена открытия (Open), цена закрытия (Close), максимальная (High) и минимальная (Low) цены акций, а также объем торгов (Volume).
В качестве источника данных используется Yahoo Finance, из-за наиболее удобного API и быстрого доступа к информации. Данные берутся в интервале с 01-01-2018 по 01-07-2022.
Архитектура моделей
Мы имеем данные по 20 компаниям за 4 года и на их основе составляется датасет, в который входят данные по цене открытия и закрытия, наибольшей и наименьшей дневных ценах, и объемах торгов. На основе этих данных строится матрица корреляции (на диагоналях 1, коэффициент корреляции может принимать значения от -1 до 1, где -1 обозначает полную обратную корреляцию, 0 – отсутствие корреляции, а 1 – полную прямую корреляцию).
Затем на основе матрицы корреляции строится граф. Вершинами которого являются названия компаний, весами – коэффициенты корреляции между соответствующими компаниями. Далее этот граф подается на вход node2vec. На выходе получаем вектор характерных признаков для каждой из компаний, на основе которого для каждой компании выбираются несколько ближайших. Таким образом формируем датасет, состоящий из цен открытия, закрытия, минимальной и максимальной цен и объемом продаж за торговый день плюс усредненные данные по этим же метрикам среди ближайших компаний.
Далее происходит нормализация данных, и затем они подаются на вход LSTM\Transformers. Блок схема алгоритма выглядит следующим образом:
Рисунок 1. Блок-схема алгоритма
Эксперименты
Результатом работы модели является прогноз на следующий день, будет цена открытия больше, либо меньше по сравнению с предыдущим торговым днем. Для начала предлагается исследовать зависимость от того, на каких данных обучать модель. Обучения можно производить на точных значениях метрик, а можно на бинарных (0 – значение метрики стало меньше, либо не изменилась; 1- значение метрики стало больше по сравнению с предыдущим торговым днем). По результатам экспериментов, изображенных на рисунке 2, видно, что точность выше, когда используются бинарные значения метрик для прогноза.
Рисунок 2. Результаты эксперимента
Так же был проведен эксперимент, в котором используется гибридная структура данных, в которых значения всех метрик, кроме объема торгов представлены в бинарном виде, а значения объемов торгов в виде точных значений. Результаты этого эксперимента можно увидеть рисунке 3.
Рисунок 3. Результаты эксперимента
Видно, что использование гибридной структуры увеличивает точность модели. В дальнейшем предлагается использовать ее.
Далее проверяется зависимость точности предсказания от «глубины запоминания» в рамках одного сектора здравоохранения. Результаты представлены на рисунке 4.
Рисунок 4. Результаты эксперимента
Можем заметить, что точность модели падает, как при уменьшении, так и сильном увеличении числа дней. Наиболее оптимальным является семидневный интервал «запоминания».
Затем проводим эксперимент зависимости точности предсказания от сектора, на котором обучалась модель. Для эксперимента берутся несколько различных секторов экономики, выбираются из них наиболее крупные компании по рейтингу S&P500 и на них происходит обучение модели. Прогнозируется стоимость компании из того же сектора, на котором обучалась модель. Результаты представлены ниже на Рисунке 5.
Рисунок 5. Результаты эксперимента
В результате можно сделать вывод, что в зависимости от секторов точность сильно не меняется.
Выводы
В работе была исследована возможность использования методов машинного обучения для прогнозирования динамики стоимости акций на основе исторических данных. Были рассмотрены два метода - LSTM и transformers - и проведено сравнение их эффективности на реальных данных из финансового сектора.
Результаты показали, что оба метода позволяют достичь высокой точности прогнозирования, однако наилучшую эффективность показывает метод на основе трансформеров.
В целом, использование методов машинного обучения для прогнозирования динамики стоимости акций может быть эффективным, однако для достижения наилучшей точности необходимо учитывать специфику отрасли.
Список литературы:
- Kumar, Sahoo, Nayak "Forecasting Stock Prices using Linear Regression, ARIMA and XGBoost models"
- Weiwei Li, "A Comparative Study of Stock Price Prediction Using Linear Regression and Artificial Neural Networks"
- Yongjin Liu, "A Deep Learning Framework for Financial Time Series using Stacked Autoencoders and Long Short-Term Memory"
- S&P 500 Health Care (SPXHC) [электронный ресурс] — Режим доступа. — URL: https://ru.investing.com/indices/s-p-500-health-care
Оставить комментарий