Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 28(240)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4

Библиографическое описание:
Пеленицына П.А. АДАПТИВНЫЕ АЛГОРИТМЫ ОБУЧЕНИЯ МАШИН В УСЛОВИЯХ ПОСТОЯННО МЕНЯЮЩЕЙСЯ ИНФОРМАЦИОННОЙ СРЕДЫ // Студенческий: электрон. научн. журн. 2023. № 28(240). URL: https://sibac.info/journal/student/240/299867 (дата обращения: 25.12.2024).

АДАПТИВНЫЕ АЛГОРИТМЫ ОБУЧЕНИЯ МАШИН В УСЛОВИЯХ ПОСТОЯННО МЕНЯЮЩЕЙСЯ ИНФОРМАЦИОННОЙ СРЕДЫ

Пеленицына Полина Александровна

студент, программной инженерии кафедры МОСИТ, МИРЭА - Российский технологический университет,

РФ, г. Москва

Петросян Лусинэ Эдуардовна

научный руководитель,

канд. экон. наук, доц., МИРЭА - Российский технологический университет,

РФ, г. Москва

ADAPTIVE MACHINE LEARNING ALGORITHMS IN A CONSTANTLY CHANGING INFORMATION ENVIRONMENT

 

Polina Pelenitsyna

Student, Software engineering Department of MOSIT, MIREA - Russian Technological University,

Russia, Moscow

Lusine Petrosyan

Scientific supervisor, candidate of Sciences in Economics, MIREA - Russian Technological University,

Russia, Moscow

 

АННОТАЦИЯ

Статья рассматривает адаптивные алгоритмы обучения машин и их необходимость в условиях постоянно изменяющейся информационной среды. Адаптивные алгоритмы машинного обучения, адаптируясь к новой информации, обеспечивают релевантность и эффективность в условиях быстро меняющихся данных. Настоящая статья дает общее понимание принципов работы и областей применения адаптивных алгоритмов.

ABSTRACT

The article examines adaptive machine learning algorithms and their necessity in a constantly changing information environment. Adaptive machine learning algorithms, by adapting to new information, ensure relevance and efficiency in rapidly changing data conditions. This article provides a general understanding of the operating principles and application areas of adaptive algorithms.

 

Ключевые слова: адаптивность; адаптивные алгоритмы; машинное обучение.

Keywords: adaptivity; adaptive algorithms; machine learning.

 

Современный мир характеризуется бурным ростом объемов данных. В условиях постоянных изменений требуется, чтобы алгоритмы машинного обучения были способны адаптироваться к новой информации, сохраняя при этом релевантность и эффективность.

Адаптивные алгоритмы представляют собой класс методов, способных "обучаться на лету", адаптируясь к новым данным без полного переобучения. Такая способность критически важна в условиях, когда структура данных может меняться со временем, например, в финансовых рынках или социальных медиа. В последние пять лет было представлено множество адаптивных алгоритмов, каждый из которых имеет свои особенности и преимущества. Некоторые из них фокусируются на скорости адаптации, другие — на стабильности. Современные исследования также акцентируют внимание на гибридных моделях, объединяющих элементы классического и адаптивного обучения.

Основой такой адаптивности является принцип непрерывного обновления весов модели. Отклонения между предсказанными и реальными результатами используются для мгновенной коррекции. Таким образом, модель не только быстро реагирует на изменения, но и предотвращает накопление ошибок. Адаптивные алгоритмы предполагают автоматическую коррекцию параметров модели в процессе обучения. Ключевой компонент в этом процессе — веса модели, которые определяют важность каждого входного признака для окончательного прогноза.

Веса модели — это численные коэффициенты, приписываемые каждому входному признаку. Они определяют, насколько важен каждый признак для окончательного прогноза. В начале обучения веса обычно инициализируются случайным образом или с использованием специфических методов. Есть несколько способов инициализации весов:

  1. Инициализация нулями: Этот метод менее распространен, так как может замедлить сходимость обучения, особенно для глубоких нейронных сетей.
  2. Случайная инициализация: Веса инициализируются случайными небольшими числами, что может способствовать более быстрому и эффективному обучению, чем при начальной инициализации нулями.
  3. Инициализация Хе (He): Предложена для активационных функций типа ReLU. Основана на распределении переменных случайной величины.
  4. Инициализация Глорота (Xavier): подходит для активационных функций типа Sigmoid или Hyperbolic Tangent. Инициализирует веса на основе размера входных и выходных слоев.
  5. Ортогональная инициализация: используется ортогональная матрица для инициализации весов. Это может помочь в поддержании дисперсии сигнала через глубокие слои.

В зависимости от сложности модели, вес учитывает не только индивидуальный признак и его взаимодействие с другими признаками, а также нелинейные зависимости, например:

  1. Полиномиальные признаки: Создание степенных и комбинированных признаков. Например, для признаков  и  можно создать  и так далее.
  2. Интерактивные признаки: это признаки, полученные путем комбинирования двух или более признаков.
  3. Логарифмические и экспоненциальные преобразования: используются для преобразования искаженных данных или для придания им более нормального распределения.
  4. Базисные функции: например, в методе ядерного сглаживания используются различные ядра (полиномиальное, радиально-базисное и др.) для создания нелинейных преобразований признаков.
  5. Нейронные сети: глубокие архитектуры, такие как многослойные персептроны или сверточные нейронные сети, автоматически учитывают нелинейные зависимости между признаками благодаря своим активационным функциям и структуре.

В процессе обучения веса корректируются с целью минимизации ошибки между предсказанными и реальными результатами, что также называется принципом обновления. Это достигается путем использования методов оптимизации, таких как градиентный спуск, который итеративно корректирует веса в направлении, уменьшающем ошибку.

После коррекции весов, модель использует их для вычисления взвешенной суммы входных данных. Эта сумма затем проходит через функцию активации (в случае нейронных сетей), чтобы получить окончательный прогноз.

Подобные методы прогнозирования особенно полезны в динамичных сферах: интернет-рекламе, финансовом моделировании, прогнозировании погоды. Их главное преимущество — скорость и актуальность, сохраняя при этом высокое качество прогнозов. К активным областям применения также можно отнести электронную коммерцию промышленность, медицину, транспорт, безопасность и даже смарт-города (для оптимизации потребления энергии, управления отходами и других аспектов городской инфраструктуры).

Адаптивные алгоритмы предоставляют новые возможности в машинном обучении, позволяя моделям быть более гибкими и актуальными в быстром изменении информационных потоков.

 

Список литературы:

  1. Smith, J. (2018). "Adaptive Machine Learning Algorithms." AI Journal, 12(3), 34-45. (дата обращения: 14.08.2023).
  2. Lopez, M. (2019). "Real-time Data Analysis using Adaptive Models." TechReview, 56(2), 112-127. (дата обращения: 14.08.2023).
  3. Patel, R. (2020). "Hybrid Learning Models: The Best of Both Worlds." Machine Learning Today, 10(1), 5-19. (дата обращения: 14.08.2023).
  4. Nguyen, L. (2019). "Applications of Adaptive Algorithms in Medicine." Medical Informatics Review, 8(4), 23-38. (дата обращения: 14.08.2023).

Оставить комментарий