Статья опубликована в рамках: V-VI Международной научно-практической конференции «Вопросы технических наук в свете современных исследований» (Россия, г. Новосибирск, 29 января 2018 г.)
Наука: Технические науки
Секция: Информатика, вычислительная техника и управление
Скачать книгу(-и): Сборник статей конференции
дипломов
ИСПОЛЬЗОВАНИЕ МАШИННОГО ОБУЧЕНИЯ ПРИ ОСМОТРЕ АВТОМОБИЛЯ ДЛЯ СТРАХОВОЙ ОЦЕНКИ ОНЛАЙН
Современные тенденции развития сферы обслуживания демонстрируют нам, что на сегодняшний день для потребителей наиболее привлекательным способом приобретения благ является получение дистанционных услуг. В последнее время в данной сфере услуг явными лидерами являются дистанционное образование и удалённое банковское обслуживание, призванные облегчить жизнь целевому потребителю и сэкономить его время. В свою очередь предоставление дистанционных услуг позволяет компаниям-поставщикам снизить издержки, открывать для себя новые рынки, существенно повысить качество предоставление услуг.
Если же говорить о рынке автострахования в России, то на данный момент он является достаточно классическим в плане предоставления дистанционных услуг. Лишь с недавнего времени государство обязало страховые компании предоставлять услугу по продаже электронных полюсов ОСАГО.
Многие страховые компании так же предоставляют услугу выезда аварийных комиссаров на место происшествия, поддержку на дорогах и выездную оценку в случае наступления страхового случая, но, пожалуй, на этом весь перечень дистанционных услуг среднестатистической страховой компании заканчивается.
Немного другая ситуация обстоит с услугой в автостраховании, которая называется КАСКО. Процедура оформления полиса очень похожа на ОСАГО, но факт осмотра автомобиля агентом является обязательным, так как от состояния автомобиля зависит размер страховой премии. И обычно очный осмотр автомобиля – это операции, довольно затратная по времени, как и для клиентов, так и для агентов.
Продажа электронных КАСКО – это способ выхода на новые региональные рынки за счёт дистанционных продаж таких полисов с помощью интернета. Введение данной услуги также позволяет страховой компании увеличить свои страховые сборы, и одной из первых занять лидирующие позиции на рынке электронного автострахования.
Электронный полис КАСКО похож на обычный, но для его оформления клиентам не нужно ехать в страховую компанию, проходить осмотр технического состояния автомобиля в специализированном центре и подписывать документы. Все, что необходимо сделать страхователю, – это на сайте с помощью калькулятора КАСКО или через оператора call-центра передать свои параметры для страхования, например, марку автомобиля, возраст водителя, опыт вождения, номер водительского удостоверения, а также необходимо передать техническое состояние автомобиля в удаленном режиме через мобильное приложение. После этого клиент может узнать цену в зависимости от предоставленных им параметров. У автовладельца будет возможность ознакомиться с правилами страхования и договором страхования. Если его все устраивает, то производится оплата страхового полиса.
Такая система по осуществлению дистанционного осмотра автомобиля для заключения договора на получение полиса КАСКО разработана в компании «Цифровое страхование» и действует в нескольких страховых компаниях. Но, однако, это решение подразумевает в себя ручную работу.
Осмотры делаются агентами или непосредственно клиентами страховых компаний через мобильное приложение. Каждый осмотр представляет из себя серию фотографий объекта страхования. Серия фотографий собирается по определенному алгоритму. Под алгоритмом понимаем набор шагов с инструкциями. Результат каждый шаг может быть одной фотографией, серией фотографий или пустотой (то есть шаг можно пропустить, фотографию не делать).
На рисунке 1 схематично представлено, как клиент страховой компании делает самостоятельный осмотр своего авто с видео фиксацией. Мобильное приложение контролирует каждый шаг. Клиент выполняет строго определённые инструкции. Готовое видео с метаданными отправляется на рассмотрение в страховую компанию.
Рисунок 1. Самостоятельный осмотр автомобиля с записью видео
На рисунке 2 отображен процесс отправки видео на сервер (в облако для гарантированного хранения) с дополнительной информацией, помогающей провести анализ и выявить возможный обман.
Рисунок 2. Алгоритм прохождения заявки на получение страховки
Представитель страховой компании – страховой эксперт – выполняет полу-автоматизированный анализ видео. Чтобы исключить человеческий фактор и повысить качество анализа, эксперту предоставляется пошаговая инструкция. Выполняя инструкцию, эксперт, проверяет все аспекты и даёт заключение по отдельным элементам. Например, «Съёмка проведена при дневном свете?», ответ может быть «да» или «нет». Система самостоятельно определяет достаточность и достоверность полученного видео (с использованием коэффициентов для разных типов авто и других объектов).
При необходимости по решению автоматической аналитической системы, клиенту отправляется предложение провести осмотр повторно. Пока осмотр не будет принят, страховая компания может отказывать в предоставлении полиса. Видео осмотров с результатами анализа сохраняется и доступно в дальнейшем при рассмотрении спорных ситуаций.
Главным недостатком такой системы ручной проверки осмотров экспертом является человеческая ошибка. Эксперт не всегда может заметить некоторых особенностей автомобиля (повреждение, несоответствие инструкции, подмену фотографий, подмену автомобиля на фотографии). Но и полностью отказаться от человеческого участия нельзя, потому что ни одна технология на данный момент не сможет предоставить систему принятия решений по набору фотографий и правил. Это объясняется тем, что существуют дополнительные факторы, влияющие на принятие решения о размере страхового вознаграждения и выдаче страхового полиса. Поэтому есть необходимость создать систему, которая бы помогала эксперту проводить проверку осмотров и уменьшала бы человеческую ошибку до минимума.
Система интеллектуального ассистента представляет из себя модуль, который будет внедрен в существующий программный комплекс «Осмотр объекта оценки онлайн при заключении договора страхования».
Модуль должен выполнять функцию помощи при оценке экспертом автомобиля. Помощь при оценке – это выделение и определение объектов на фотографиях осмотра (главный объект – автомобиль и его части), определение и выделение неисправностей (царапины, потертости, сколы, вмятины, отсутствие элементов кузова) и акцентирование внимания эксперта на найденных неисправностях. То есть функции модуля сводятся к распознаванию ракурса и элемента автомобиля, распознаванию одного автомобиля в серии фотографий и распознавание повреждений.
Было выделено четыре задачи, которыми будет заниматься модуль:
1. Выявление несоответствия инструкции проведения осмотра.
2. Построение визуальной карты элементов автомобиля из частей различных фотографий.
3. Определение соответствия автомобиля на фотографиях заявленной марке и модели.
4. Распознавание повреждений.
Инструкции к осмотрам типизированные. Например, «сделать фото крыши с определённого ракурса». Агенты нарушают указания и делают так, как им удобнее, то есть не всегда в соответствии с инструкцией. Поэтому систему необходимо постоянно обучать достоверно правильными фотографиями, соответствующими инструкциям, без учёта марки/модели. Также можно обучать систему фотографиями, на которых присутствует нужная деталь, но неправильный ракурс. Также системе можно подавать мнемоническое обозначение инструкции. И на выходе нужно знать степень соответствия инструкции.
В задачу про визуальную карту деталей будет включены нарезанные фотографии осмотра c вынесенными отдельными областями, на которях запечатлён только один отдельный элемент автомобиля, например, бампер, лобовое стекло, левая водительская дверь, правая пассажирская дверь и т. п. То есть, если дверь попала на три фотографии под разным углом, то эти три фотографии должны попасть в выборку с обозначенными контурами по запрос системе в виде «осмотр 1024, передняя правая дверь». Это нужно для того, если в случае аварии и повреждения конкретного элемента автомобиля можно было бы посмотреть, как этот элемент выглядел на осмотре. Также это будет полезно для поиска повреждений. Имея классификацию «деталь – типовые повреждения» и зная, где на фотографиях расположена нужная деталь, можно лучше искать на ней повреждения. Особенно это актуально для обработки видео. Видео можно разбить на отдельные кадры, выделить из них различающиеся ракурсы, загрузить в систему и получить на выходе перечень повреждений.
В задаче определения соответствия автомобиля в серии фотографий заявленной марке и модели модуль должен оповещать эксперта, если было найдено отклонение. Отклонением считаем отличные автомобили от основного автомобиля серии. Основной автомобиль задан вручную, то есть нам заранее известна модель, марка, год выпуска и, возможно, другие отличительные черты. На вход системы подается фотографии осмотра и название марки/модели. На выходе получить степень схожести в процентах.
В задаче по определению повреждений на входе – все фотографии осмотра. На выходе получаем список возможных повреждений с вероятностными характеристиками, плюс отсылку к конкретной фотографии и координатам на ней. Список типовых повреждений будет браться из приложения 2 к приложению к положению Банка России от «19» сентября 2014 года № 432-П «О единой методике определения размера расходов на восстановительный ремонт в отношении поврежденного транспортного средства» с некоторыми изменениями.
Для проведения экспериментов было принято решение остановиться на задаче распознавания ракурса автомобиля, то есть соответствие инструкции. Для сравнения было выбрано два подхода к анализу фотографий: использование нейронных сетей и каскадов Хаара, так как алгоритмы с использованием этих технологий лучше работают с изображениями.
Для решения задачи путем каскадов Хаара был выбран классификатор Viola-Jones. Для обучения на вход классификатора сначала подаётся набор верных фотографий с предварительно выделенной областью на изображении, дальше происходит перебор примитивов и расчёт значения признака. Вычисленные значения сохраняются в файле в формате xml.
Основное преимущество детектора Хаара – это скорость. Благодаря быстрой обработки изображения, можно с лёгкостью обрабатывать потоковое видео [3]. Каскады Хаара используются для распознавания разных классов объектов. К ним относятся лица и другие части тела людей, номера автомобилей, дорожные знаки, животные и т. д.
В настоящее время метод Виолы–Джонса является популярным методом для поиска объекта на изображении в силу своей высокой скорости и эффективности. В основу этого метода положены интегральное представление изображения по признакам Хаара, построение классификатора на основе алгоритма адаптивного бустинга и способ комбинирования классификаторов в каскадную структуру [1].
Но, однако, у этого способа есть ряд недостатков:
- Неустойчивость при смене освещения
- Неустойчивость при изменении масштаба или повороте изображения
- Неустойчивость, если часть изображения — изменяющийся фон
В качестве нейронных сетей было принято рассматривать свёрточные и капсульные нейронные сети.
Свёрточные нейронные сети (СНС, convolutional neural network, CNN) очень похожи на обычные нейронные сети: они также построены на основе нейронов, которые обладают изменяющимся весом и смещениями. Каждый нейрон получает некоторые входные данные, выполняет скалярное произведение информации и в отдельных ситуациях сопровождает это нелинейностью [8]. Пример устройства сверточной сети представлен на рисунке 3. Как и в случае с обычными нейронными сетями, вся CNN выражает одну дифференцируемую функцию взноса (эффективный взнос): с одной стороны это необработанные пиксели изображения, с другой — вывод класса или группы вероятных классов, характеризующих картинку. Здесь также присутствует функция потери на последнем (полностью подключенном) слое, а все преимущества и хитрости обычных нейронных сетей остаются справедливыми при работе с CNN.
Рисунок 3. Пример свёрточной нейронной сети
До сих пор сверточные нейронные сети были самым современным подходом к классификации изображений. Они работают, накапливая множество функций на каждом уровне. Начинается с поиска краев, затем фигур, а затем фактических объектов. Однако информация о пространственных отношениях всех функций теряется. То есть если изменить изображение, например, поменять элементы местами, то сеть не увидит разницы и посчитает это за правильный объект [6].
Капсульные сети не обладают недостатком современных нейронных, которым для обучения требуется огромное число изображений с примерами. Это происходит потому, что программы не умеют обобщать и адаптироваться к новым обстоятельствам, например, не понимают, что перед ними тот же предмет с другого ракурса. Капсулы — небольшие группы виртуальных нейронов — служат для того, чтобы отслеживать различные части предмета, например, нос или ухо кота, и их относительное положение в пространстве. Сеть таких капсул позволит понять, когда на изображении действительно что-то новое, а когда — то же самое, просто под другим углом.
Но, возможно, что сверточные сети окажутся более эффективными при вращении изображения, так как в этом случае они считают объект новым, когда капсульные будут рассматривать объект как уже опознанный. И в нашей ситуации для задачи соответствия инструкции, то есть формально распознавания ракурса, это подходит, так как инструкции могут быть очень похожи друг на друга, но отличаться только стороной, например, «Задний бампер и левая сторона под углом» и «Задний бампер и правая сторона под углом».
Одной из самых больших задач в рамках исследования – был сбор данных для обучающей модели. Готовые корпуса не удовлетворяют задачам исследования, потому что в основном они размечены на обобщенный класс «Автомобили», а нам нужны конкретные ракурсы и элементы. На текущий момент было собрано около 154 480 изображений автомобилей с различных ракурсов. Фотографии были собраны из свободных источников. Размечено примерно 10% фотографий.
В качестве обучающего датасета была сделана выборка из имеющихся изображений. Эти изображения были отнесены к 14 классам:
- Передний бампер прямо
- Задний бампер прямо
- Боковая правая сторона прямо
- Боковая левая сторона прямо
- Передний бампер и левая сторона под углом
- Передний бампер и правая сторона под углом
- Задний бампер и левая сторона под углом
- Задний бампер и правая сторона под углом
- Салон (вид торпеды) с передних сидений
- Салон (вид торпеды) с задних сидений
- Задние сидения салона справа
- Задние сидения салона слева
- Передние сидения салона справа
- Передние сидения салона слева
Всего изображений получилось около 2000, что примерно по 150 изображений в классе. В качестве контрольного датасета были взяты размеченные изображения в пропорции 70/30. Для работы была выбрана библиотека Keras с поддержкой Tensorflow.
Keras — это удобная высокоуровневая библиотека для глубокого обучения, работающая поверх Theano или Tensorflow. В ее основе лежат слои, соединяя которые между собой, можно получить модели. Созданные однажды модели и слои сохраняют в себе свои внутренние параметры, и потому, например, можно обучить слой в одной модели, а использовать его уже в другой. Их можно легко загружать и сохранять, и при необходимости использовать в фреймворках Tensorflow или Theano как операции над тензорами [5].
Для экспериментов было взято несколько конфигураций сверточной сети и одна конфигурация капсульной, которые представлены на рисунках 4 и 5.
Рисунок 4. Используемые конфигурации CNN
Рисунок 5. Конфигурация капсульной сети
Из-за малого количества обучающей выборки для сверточных сетей было принято решение программно увеличить количество изображений с помощью вращения каждого изображения на 25 градусов, но без эффекта «зеркалирования» изображение. В итоге получилось порядка 15500 изображений на 14 классов. Ещё пробовали объединять классы в более большие, сократив их количество до 9. Для капсульной сети использовались исходные данные без преобразований. Результаты отображены в таблице 1.
Таблица 1.
Результаты экспериментов с разными конфигурациями нейронных сетей
Конфигурация сети |
Общая точность, % |
Общая ошибка, % |
CNN, 1 конфигурация, 50 эпох, 16 изображений/ шаг, изображение размеров 256x256, 14 классов |
42,6 |
58 |
CNN, 2 конфигурация, 50 эпох, 16 изображений/ шаг, изображение размеров 256x256, 14 классов |
54 |
46,3 |
CNN, 1 конфигурация, 50 эпох, 32 изображений/ шаг, изображение размеров 256x256, 9 классов |
43 |
55 |
CNN, 2 конфигурация, 50 эпох, 32 изображений/ шаг, изображение размеров 256x256, 9 классов |
54 |
46,5 |
Капсульная сеть, 20 эпох, 100 изображений / шаг, изображение размеров 28x28, 14 классов |
71 |
16 |
Капсульная сеть, 50 эпох, 32 изображений / шаг, изображение размеров 64x64, 14 классов |
69 |
35 |
Из таблицы видим, что капсульные сети справляются лучше даже на довольно маленьком объеме обучающих данных. К сожалению, программное увеличение количества изображений не дало ожидаемого эффекта и фактический прирост точности был не более 5%. Поэтому после первого этапа экспериментов появилась гипотеза о том, что увеличение выборки исправит ситуацию в лучшую сторону.
В планах на первый этап экспериментов была заложена проверка алгоритма на каскадах Хаара, но в виду ограниченных временных ресурсов в полном объеме не получилось провести эксперимент. Была произведена подготовка урезанных данных для проведения эксперимента. Были выбраны четыре класса: два максимально близких, третий отдаленно похожий и четвертый резко отличающийся от других: «Задний бампер и левая сторона под углом», «Задний бампер и правая сторона под углом», «Задний бампер прямо», «Салон (вид торпеды) с задних сидений». Были построены обучающие каскады на эти четыре класса. Так же, как и с нейронными сетями, были попытки программно увеличить количество изображений в классе, но к явному улучшению это не привело. Каскады плохо работают на различия ракурсов, так как в основном они применяются ко всей машине целиком. Поэтому есть гипотеза, что они будут работать лучше на задаче распознавания элементов и повреждений.
В ближайших планах исследования есть задачи по увеличению размеченного корпуса собранных изображений, проведения второго этапа экспериментов на задаче определения соответствия инструкции и первого этапа экспериментов для задачи поиска элементов автомобиля в осмотре.
Список литературы:
- Viola P., Jones M. Robust real-time face detection. – IJCV 57(2), 2004
- Lienhart R., Kuranov E., Pisarevsky V. Empirical analysis of detection cascades of boosted classifiers for rapid object detection. – In: PRS, 2003, pp. 297-304
- Использование каскада Хаара для сравнения изображений [Электронный ресурс]. – Режим доступа: https://habrahabr.ru/post/198338, свободный.
- Метрики в задачах машинного обучения [Электронный ресурс]. – Режим доступа: https://habrahabr.ru/company/ods/blog/328372/, свободный.
- Библиотеки для глубокого обучения: Keras [Электронный ресурс]. – Режим доступа: https://habrahabr.ru/company/ods/blog/325432/, свободный.
- Капсульные сети встряхивают AI: вот как их использовать [Электронный ресурс]. – Режим доступа: https://proglib.io/p/capsule-networks/, свободный.
- Building powerful image classification models using very little data использовать [Электронный ресурс]. – Режим доступа: https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html, свободный.
- Свёрточные нейронные сети: взгляд изнутри [Электронный ресурс]. – Режим доступа: http://ru.datasides.com/code/cnn-convolutional-neural-networks/, свободный.
- Анализ изображений с помощью scikit-image [Электронный ресурс]. – Режим доступа: http://www.machinelearning.ru/wiki/images/1/16/Scikit-image.pdf, свободный.
- Оценка классификатора (точность, полнота, F-мера) [Электронный ресурс]. – Режим доступа: http://bazhenov.me/blog/2012/07/21/classification-performance-evaluation.html, свободный.
- Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin. Learning From Data. – AMLBook, 2012.
- Vladimir Cherkassky, Filip M. Mulier. Learning from Data: Concepts, Theory, and Methods. – Wiley-IEEE Press; 2 edition, 2007.
дипломов
Оставить комментарий