Статья опубликована в рамках: Научного журнала «Студенческий» № 31(75)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
МАШИННОЕ ОБУЧЕНИЕ С УЧИТЕЛЕМ
Классическое машинное обучение нередко делят на две основные категории – машинное без учителя и обучение с учителем. Обучение без учителя (англ. unsupervised learning) подразумевает то, что у машины нет изначально размеченных категорий, по которым машина должна разнести данные, задача машины в этом случае – нахождение некоторых внутренних закономерностей. При обучении с учителем (англ. supervised learning) есть некоторые входные данные и эталонные выходы – взаимосвязь межу парами входные данные – эталонный выход называется обучающей выборкой. На основе этих данных устанавливается алгоритмическая зависимость, согласно которому машина будет способна выдать достаточно точный ответ для входа, не входящего в обучающую выборку [1].
Из вышесказанного можно сделать очевидный вывод о том, что обучение машины с учителем происходит точнее и намного быстрее, поэтому данный вид обучения является наиболее часто применяемым на практике.
Задачи, для которых применяется классическое машинное обучение с учителем делятся на два типа:
- Задачи классификации;
- Задачи на регрессию.
Классификация – это получение категориального ответа на основе набора признаков [3]. Является одной из самых распространенных задач машинного обучения.
Для решения этой задачи всегда необходим учитель, а именно размеченные данные с признаками и категориям.
Основными алгоритмами для задач классификации являются:
- Наивный байесовский классификатор – является одним из самых простых и первых практически полезных алгоритмов, берет свое начало из теоремы Байеса, часто использовался для фильтрования спама, но позже был заменен более совершенными алгоритмами;
- Деревья решений – метод принятия решения на основе взвешенного дерева (в качестве весов используются вероятности), получил широкое распространение в области медицины и финансов. Редко используются в чистом виде, намного чаще используют ансамбли деревьев;
- Метод опорных векторов – набор алгоритмов, необходимых для решения задач на классификацию и регрессионный анализ [2]. Суть алгоритма заключается в нахождении способа проведения двух прямых между точками (категориями), чтобы между прямыми образовалось наибольшее расстояние. Метод опорных векторов обладает особенностью – обнаружение аномалий, благодаря этому он широко применяется в медицине, но, разумеется, этим его применение не ограничивается.
Регрессия – это прогноз на основе выборки объектов с различными признаками. По сути является сходной задачи классификации, единственное отличие заключается, что в этот раз машине необходимо определить не категорию, а какое-то количественное значение, как следствие имеет широкое распространение в случаях, когда одним из параметров является время.
Основу регрессионного анализа составляет метод наименьших квадратов (МНК), основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных [4].
Иногда ошибочно к алгоритмам регрессионного анализа относят логистическую регрессию, которая в свою очередь является алгоритмом классификации.
Кроме того, схожесть задач классификации и регрессии подтверждается тем фактом, что первые после незначительного изменения могут быть сведены ко вторым.
В качестве вывода можно отметить, что приведенное деление по виду решаемых задач и алгоритмов их решающих, является достаточно удобным при рассмотрении классического машинного обучения с учителем.
Список литературы:
- Введение в машинное обучение — Хабр [Электронный ресурс]. – Режим доступа: https://habr.com/ru/post/448892/ (дата обращения: 18.09.19)
- Открытый курс машинного обучения. Тема 7. Обучение без учителя: PCA и кластеризация [Электронный ресурс]. – Режим доступа: https://habr.com/ru/company/ods/blog/325654/ (дата обращения: 20.09.19)
- Wikipedia: Обучение без учителя [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Обучение_без_учителя (дата обращения: 20.09.19)
- Wikipedia: Метод наименьших квадратов [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Метод_наименьших_квадратов (дата обращения: 20.09.19)
Оставить комментарий