Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 31(75)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3

Библиографическое описание:
Маланьин Д.Д. МАШИННОЕ ОБУЧЕНИЕ С УЧИТЕЛЕМ // Студенческий: электрон. научн. журн. 2019. № 31(75). URL: https://sibac.info/journal/student/75/153985 (дата обращения: 02.01.2025).

МАШИННОЕ ОБУЧЕНИЕ С УЧИТЕЛЕМ

Маланьин Данила Дмитриевич

студент, Институт комплексной безопасности и специального приборостроения, кафедра «Защита информации», МИРЭА - Российский технологический университет,

РФ г. Москва

Классическое машинное обучение нередко делят на две основные категории – машинное без учителя и обучение с учителем. Обучение без учителя (англ. unsupervised learning) подразумевает то, что у машины нет изначально размеченных категорий, по которым машина должна разнести данные, задача машины в этом случае – нахождение некоторых внутренних закономерностей. При обучении с учителем (англ. supervised learning) есть некоторые входные данные и эталонные выходы – взаимосвязь межу парами входные данные – эталонный выход называется обучающей выборкой. На основе этих данных устанавливается алгоритмическая зависимость, согласно которому машина будет способна выдать достаточно точный ответ для входа, не входящего в обучающую выборку [1].

Из вышесказанного можно сделать очевидный вывод о том, что обучение машины с учителем происходит точнее и намного быстрее, поэтому данный вид обучения является наиболее часто применяемым на практике.

Задачи, для которых применяется классическое машинное обучение с учителем делятся на два типа:

  1. Задачи классификации;
  2. Задачи на регрессию.

Классификация – это получение категориального ответа на основе набора признаков [3]. Является одной из самых распространенных задач машинного обучения.

Для решения этой задачи всегда необходим учитель, а именно размеченные данные с признаками и категориям.

Основными алгоритмами для задач классификации являются:

  1. Наивный байесовский классификатор – является одним из самых простых и первых практически полезных алгоритмов, берет свое начало из теоремы Байеса, часто использовался для фильтрования спама, но позже был заменен более совершенными алгоритмами;
  2. Деревья решений – метод принятия решения на основе взвешенного дерева (в качестве весов используются вероятности), получил широкое распространение в области медицины и финансов. Редко используются в чистом виде, намного чаще используют ансамбли деревьев;
  3. Метод опорных векторов – набор алгоритмов, необходимых для решения задач на классификацию и регрессионный анализ [2]. Суть алгоритма заключается в нахождении способа проведения двух прямых между точками (категориями), чтобы между прямыми образовалось наибольшее расстояние. Метод опорных векторов обладает особенностью – обнаружение аномалий, благодаря этому он широко применяется в медицине, но, разумеется, этим его применение не ограничивается.

Регрессия – это прогноз на основе выборки объектов с различными признаками. По сути является сходной задачи классификации, единственное отличие заключается, что в этот раз машине необходимо определить не категорию, а какое-то количественное значение, как следствие имеет широкое распространение в случаях, когда одним из параметров является время.

Основу регрессионного анализа составляет метод наименьших квадратов (МНК), основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных [4].

Иногда ошибочно к алгоритмам регрессионного анализа относят логистическую регрессию, которая в свою очередь является алгоритмом классификации.

Кроме того, схожесть задач классификации и регрессии подтверждается тем фактом, что первые после незначительного изменения могут быть сведены ко вторым.

В качестве вывода можно отметить, что приведенное деление по виду решаемых задач и алгоритмов их решающих, является достаточно удобным при рассмотрении классического машинного обучения с учителем.

 

Список литературы:

  1. Введение в машинное обучение — Хабр [Электронный ресурс]. – Режим доступа: https://habr.com/ru/post/448892/ (дата обращения: 18.09.19)
  2. Открытый курс машинного обучения. Тема 7. Обучение без учителя: PCA и кластеризация [Электронный ресурс]. – Режим доступа: https://habr.com/ru/company/ods/blog/325654/ (дата обращения: 20.09.19)
  3. Wikipedia: Обучение без учителя [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Обучение_без_учителя (дата обращения: 20.09.19)
  4. Wikipedia: Метод наименьших квадратов [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Метод_наименьших_квадратов (дата обращения: 20.09.19)

Оставить комментарий