Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: CLXXI Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 21 августа 2023 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Никанов П.А., Батурин К.А. ПРОБЛЕМЫ УНИВЕРСАЛЬНОСТИ СОВРЕМЕННЫХ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. CLXXI междунар. студ. науч.-практ. конф. № 16(170). URL: https://sibac.info/archive/meghdis/16(170).pdf (дата обращения: 29.12.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ПРОБЛЕМЫ УНИВЕРСАЛЬНОСТИ СОВРЕМЕННЫХ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

Никанов Павел Александрович

студент, кафедра математического и программного обеспечения электронных вычислительных средств, Рыбинский государственный авиационный технический университет имени П.А. Соловьева,

РФ, г. Рыбинск

Батурин Кирилл Александрович

студент, кафедра математического и программного обеспечения электронных вычислительных средств, Рыбинский государственный авиационный технический университет имени П.А. Соловьева,

РФ, г. Рыбинск

Копачев Михаил Юрьевич

научный руководитель,

доц., кафедра математического и программного обеспечения электронных вычислительных средств, Рыбинский государственный авиационный технический университет имени П.А. Соловьева,

РФ, г. Рыбинск

К 2023 году популярность нейронных сетей сильно возросла за счёт таких генераторов медиаконтента, как ChatGPT и Midjourney, что, в свою очередь, породило в обществе ложные представления о них.

В первую очередь необходимо пояснить, что из себя представляют искусственные нейронные сети. В 1943 году у учёных нейролингвистов и нейрофизиологов Уоррена Мак-Каллока и Уолтера Питтса, стоявших у основ кибернетики, зародилась революционная идея, что человеческий мозг — это компьютер [1]. Искусственная нейронная сеть — математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. То есть искусственные нейронные сети — это весьма упрощенное и, возможно, не самое правильное представление о работе мозга.

Теперь необходимо пояснить, как создаются искусственные нейронные сети. Существует несколько этапов создания искусственных нейронных сетей [4]:

  • Сбор данных для обучения — накопление такого набора данных, который связан с поставленной задачей и может быть использован как для обучения, так и для валидации искусственной нейронной сети. Этот этап является самым ответственным, ведь, чем качественнее подобраны примеры, тем более детерминированным будет результат.
  • Подготовка и нормализация данных — преобразование данных в вид, который искусственная нейронная сеть может принять и обработать.
  • Выбор топологии. Тип искусственной нейронной сети зависит от поставленной задачи и возможности дать экспертную оценку данным для обучения.
  • Экспериментальный подбор характеристик сети — подбор количества скрытых слоев, количества связей между ними и функций активации.
  • Экспериментальный подбор параметров обучения — подбор коэффициента скорости обучения, и тому подобное.
  • Обучение. В процессе обучения искусственной нейронной сети на вход подаются данные из обучающей выборки. По окончанию очередного этапа производится валидация на тестовой выборке: если значение ошибки уменьшается, значит, обучение идёт в правильном направлении, если же ошибка растёт, причём только на тестовой выборке, значит, имеет место “переобучение”.
  • Проверка адекватности обучения. Основной принцип, на котором работает искусственная нейронная сеть, — это обобщение. Бывают случаи, когда она обобщает совсем не то, что от неё ожидали. Это происходит, как правило, из-за недостаточного количества независимых данных.
  • Корректировка параметров, окончательное обучение. После оценки искусственной нейронной сети принимается решение о необходимости изменения характеристик сети.

Есть еще один этап решения задачи с помощью искусственных нейронных сетей — это вербализация сети с целью дальнейшего использования, а именно: преобразование того решения и тех закономерностей, которые вывела искусственная нейронная сеть в несколько взаимозависимых алгебраических или логических функций. Это позволяет не использовать саму искусственную нейронную сеть в итоговом решении, что ускоряет решение задачи во много раз, однако препятствует её дальнейшему обучению.

Одним из способов вербализации нейронной сети прямого распространения является замена сложно вычисляемых функций активации на полином, и упрощение функции, вычисляемой сетью в целом. Такая сеть, по сути, является «длинной» функцией, в которую входят значения весовых коэффициентов, входов, смещений нейронов. Идея состоит в том, чтобы выписать эту самую функцию , заместить однотипные сложные функции активации однотипными полиномами (например, при помощи метода наименьших квадратов), а затем алгебраически её упростить. Таким образом будет получена функция  в некоторой степени менее точно решающая поставленную задачу, однако дающая выигрыш по скорости работы.

Из всего вышесказанного можно сделать вывод, что искусственная нейронная сеть не может думать и каким-либо образом мыслить, ведь она — всего лишь алгоритм, который решает какую-либо задачу, инструмент, и её можно представить в виде математических формул и закономерностей, а процесс мысли, на данный момент, невозможно преобразовать в алгебраические и логические функции.

Как представляется, в этапах создания искусственных нейронных сетей присутствуют этапы, в которых идёт экспериментальный подбор каких-либо параметров и проверка адекватности обучения. Это всё не случайно, ведь у искусственных нейронных сетей есть свои проблемы, которые создают неудобства как их создателям, так и пользователям. Рассмотрим лишь некоторые из них.

Искусственная нейронная сеть ограничена в самом её строении, потому что она узко специализирована [3], то есть искусственная нейронная сеть, созданная и обученная для решения одной задачи, не сможет решить другую. А человеческий мозг может это делать.

Ещё одна проблема искусственных нейронных сетей заключается в невозможности выявления причинно-следственных связей решения, так как нельзя понять, где и как алгоритм, который обучался на определенных выборках, мог дать сбой. В качестве примера можно взять ChatGPT, который при предоставлении какой-либо информации из статей может генерировать несуществующие номера статей и неверные факты [2], которые логичны для данной искусственной нейронной сети.

Таким образом, можно сказать, что на данный момент искусственные нейронные сети имеют несколько проблем. Существуют ограничения, лежащие в основе технологии, ведь искусственная нейронная сеть подразумевает возможность моделирования процессов, происходящих в человеческом мозге, в реальности же аппроксимированная модель может оказаться ложной. Имеет место узкая специализированность, выход за рамки которой может привести либо к переобучению модели, либо к проблемам её адекватности при проверке на схожих, по мнению человека, данных.

 

Список литературы:

  1. Мак-Каллок У.С. Логическое исчисление идей, относящихся к нервной активности / У.С. Мак-Каллок, В. Питтс // Автоматы / Под ред. К.Э. Шеннона, Дж. Маккарти. — М.: Изд-во иностр. лит., 1956. — С. 363—384. (Перевод английской статьи 1943 г.)
  2. Нейросеть ChatGPT: новый бесплатный чат-бот с искусственным интеллектом [Электронный ресурс]. —, 2023. — URL: https://rb.ru/analytics/all-about-chatgpt/ (дата обращения 27.02.2023).
  3. Рахметуллаев М.А. Искусственные нейронные сети в военной сфере / М.А. Рахметуллаев, Л.Б. Алтынбекова // Молодой учёный. — 2020. — № 19 (309). — С. 48—53.
  4. Этапы решения задач [Электронный ресурс]: конспект лекции. —, 2015. — URL: https://studfile.net/preview/4289584/page:5/ (дата обращения: 27.02.2023).
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий