Статья опубликована в рамках: CXLIII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 07 ноября 2024 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
ЛИНЕЙНАЯ РЕГРЕССИЯ КАК ИНСТРУМЕНТ ДЛЯ ПРОГНОЗИРОВАНИЯ ЦЕН БИТКОИНА
LINEAR REGRESSION AS A TOOL FOR FORECASTING BITCOIN PRICES
Azamat Zhanuzakov
student of the field of study 09.04.01, Moscow Aviation Institute (National Research University),
Russia, Moscow
Zhanat Zhumatayeva
scientific supervisor, Candidate of Sciences in Technologies, Associate professor, Branch "Voskhod" of the Moscow Aviation Institute in Baikonur,
Kazakhstan, Baikonur
АННОТАЦИЯ
В данной работе планируется разработка интеллектуальной системы для прогнозирования цен на биткоин с использованием метода линейной регрессии. Актуальность исследования обусловлена высокой волатильностью криптовалютного рынка и необходимостью создания инструментов для повышения точности прогнозов.
ABSTRACT
In this work, it is planned to develop an intelligent system for predicting Bitcoin prices using the linear regression method. The relevance of the study is due to the high volatility of the cryptocurrency market and the need to create tools to improve the accuracy of forecasts.
Ключевые слова: модель, криптовалюта, обучение, регрессия, прогнозирования.
Keywords: model, cryptocurrency, training, regression, forecasting.
Биткоин и другие криптовалюты стали важной частью глобальной финансовой системы, однако их рынок характеризуется высокой волатильностью и нестабильностью. Изменение цен на криптовалюты часто зависит от множества факторов, включая новости, макроэкономические условия и поведение инвесторов, что затрудняет точное прогнозирование.
Прогнозирование цен на биткоин становится важным инструментом для трейдеров, инвесторов и аналитиков, стремящихся минимизировать риски и находить выгодные возможности для сделок. Разработка интеллектуальных систем прогнозирования может повысить точность предсказаний, помочь автоматизировать инвестиционные стратегии и обеспечить конкурентное преимущество на рынке.
Для прогнозирования существуют несколько моделей. Самыми востребаванными являются - модель-ARIMA, экспоненциальное сглаживание (SES) и линейная регрессия.
ARIMA (Autoregressive Integrated Moving Average) — это популярная модель для прогнозирования временных рядов, которая учитывает автокорреляции в данных и сглаживает шум за счет скользящих средних. Она особенно эффективна при анализе данных с сезонностью и трендами. Однако эта модель требует тщательного подбора параметров и предполагает, что связи в данных остаются стабильными со временем.
Простое экспоненциальное сглаживание (SES) — это модель прогнозирования временных рядов, которая придает больший вес недавним наблюдениям, уменьшая влияние старых данных. Она проста в реализации и хорошо работает для данных с минимальными колебаниями. SES часто используется для быстрого прогнозирования, так как требует мало вычислительных ресурсов. Однако модель не способна учитывать влияние внешних факторов, что ограничивает ее применение для комплексного анализа.
Модели, такие как ARIMA и простое экспоненциальное сглаживание (SES), активно применяются для прогнозирования временных рядов, включая цены на финансовых рынках. ARIMA хорошо учитывает автокорреляции и тренды, а SES быстро реагирует на недавние изменения, придавая больший вес последним значениям. Однако обе модели имеют ограничения: ARIMA сложна в настройке, а SES плохо справляется с данными, содержащими тренды или волатильность и не учитывает внешние факторы. В отличие от них, линейная регрессия проще в реализации и позволяет учитывать сразу несколько переменных, что делает ее более универсальной для прогнозирования цен на биткоин.
Использование линейной регрессии, как одной из значимых моделей машинного обучения, позволяет начать с простого и интерпретируемого подхода. Несмотря на ограничения данного метода в условиях сложных и нелинейных зависимостей, он может служить основой для первичного анализа и проверки гипотез. Это делает линейную регрессию удобным инструментом для создания первой версии интеллектуальной системы прогнозирования и дальнейших улучшений.
Целью данной работы является разработка и исследование модели линейной регрессии для прогнозирования цен на биткоин на основе исторических данных. Планируется создать прототип интеллектуальной системы, способной предсказывать цену закрытия криптовалюты, и провести анализ качества модели. В ходе работы предполагается выявить ограничения линейного подхода и определить направления для дальнейших улучшений с учетом специфики криптовалютного рынка.
В данной работе будет рассмотрен процесс создания модели, включающий сбор данных, их предобработку, построение модели и оценку точности.
Выбранная модель – «линейная регрессия». Линейная регрессия - один из самых эффективных и понятных способов прогнозирования значений. Он работает лучше всего, когда есть данные, которые можно хорошо округлить прямой линией или плоскостью. Еще одним преимуществом является то, что линейная регрессия объясняется очень просто. Просто глядя на коэффициент регрессии, можно отслеживать, как предикторы влияют на переменную. Кроме того, базовая математика линейной регрессии очень проста и понятна.
Для разработки модели прогнозирования цен на биткоин важно использовать надежный и актуальный источник данных. Одним из популярных сервисов является Yahoo Finance, который предоставляет доступ к историческим и текущим финансовым данным. Данный сервис обеспечивает высокое качество данных и проверенные котировки, что помогает снижать вероятность ошибок в анализе.
Одним из ключевых преимуществ Yahoo Finance является глубокая история данных, что позволяет обучать модель на длительных временных рядах. Данные доступны в формате CSV. Это позволяет их обработать в аналитических инструментах, таких как Python. Кроме того, Yahoo Finance предоставляет данные в режиме реального времени, что особенно полезно для тестирования модели в условиях рынка.
После сбора данных необходимо выполнить их предобработку, чтобы обеспечить корректное обучение модели и снизить вероятность ошибок.
1. Загрузка данных: полученные данные обычно включают следующие ключевые параметры: цена открытия (Open), цена закрытия (Close), максимальная (High) и минимальная (Low) цены за день, объем торгов (Volume) и дата записи. Эти признаки будут использоваться для построения модели.
2. Обработка пропущенных значений: на практике в данных могут встречаться пропуски, например, из-за отсутствия торгов в выходные или праздничные дни. Такие значения можно удалить.
3. Разделение данных на выборки: после нормализации данные необходимо разделить на обучающую выборку (например, 80% данных) и тестовую выборку (20%). Это позволит обучить модель на одной части данных и проверить ее точность на другой, чтобы избежать переобучения.
Для построения модели линейной регрессии используется язык программирования Python с библиотекой scikit-learn. Scikit-learn предоставляет удобные инструменты для реализации машинного обучения. Дополнительно применяются библиотеки pandas для обработки данных и matplotlib для визуализации.
Построение модели состоит из нескольких этапов:
1. Подготовка данных: для обучения модели используется историческая информация о ценах биткоина, включая такие признаки, как цена открытия, максимальная и минимальная цена, объем торгов и цена закрытия. Эти данные загружаются в программу и делятся на две части: обучающую выборку (80% данных) и тестовую выборку (20%).
2. Обучение модели: модель линейной регрессии обучается на обучающей выборке. В процессе обучения алгоритм определяет оптимальные коэффициенты для каждого признака, чтобы минимизировать разницу между предсказанными и фактическими значениями цены закрытия.
3. Прогнозирование: после обучения модель используется для прогнозирования цены закрытия на основе тестовой выборки. Это позволяет проверить, насколько точно модель справляется с задачей предсказания, применяя ранее невидимые данные.
4. Оценка точности: Коэффициент детерминации R2 , который отражает долю объясненной моделью вариативности. Значение R2, близкое к 1, свидетельствует о высоком качестве модели. Если же он близок к 0, линейная регрессия неэффективна.
Таким образом, линейная регрессия является мощным и доступным инструментом для прогнозирования цен на биткоин и другие финансовые активы. Она предлагает простоту в реализации и ясность в интерпретации результатов, что делает ее идеальным выбором как для начинающих аналитиков, так и для опытных специалистов. Используя линейную регрессию, можно быстро выявить ключевые взаимосвязи между факторами и ценой, что помогает принимать обоснованные решения на рынке. Хотя у линейной регрессии есть свои ограничения, такие как предположение о линейности и чувствительность к выбросам, её преимущества перевешивают недостатки. Многофакторный подход и комбинирование с другими методами регрессии могут значительно улучшить точность прогнозов.
Линейная многофакторная регрессия будет применяться в качестве модели прогнозирования стоимости биткоина в разрабатываемом программном продукте. Использование линейной регрессии — надежный помощник в сфере финансовых рынков.
Список литературы:
- Донго Сюй, Данило П. Мандич. Сходимость метода глубокого обучения RMSProp со штрафом за невыпуклую оптимизацию. Нейронные сети, том 139, июль 2021 г., страницы 17-23.
- Ли Цзяньпин. Исследование прогнозирования тренда акций на основе двухуровневой модели LSTM. Научные технологии и инновации, 2021 (07): 50-51.
- Айвазян С.А. Мхитарян, В.С. Прикладная статистика и основы эконометрики. М.: Юнити-Дана. 2001. 656 с.
- Ariyo A.A., et al. (2014). Прогноз цен на акции с использованием модели ARIMA. 2014 UKSim-AMSS 16-я международная конференция по компьютерному моделированию и имитационному моделированию, ТЕЕЕ.
дипломов
Оставить комментарий