Статья опубликована в рамках: XXXI Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 28 апреля 2015 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
дипломов
ПРИМЕНЕНИЕ АЛГОРИТМА K-MEANS, НЕЙРОННОЙ СЕТИ ХЭММИНГА И МЕТОДА ВИОЛЫ-ДЖОНСА ДЛЯ РАСПОЗНАВАНИЯ ТЕКСТА
Барсуков Андрей Алексеевич
Минаев Александр Сергеевич
Шипилов Сергей Сергеевич
студенты 4 курса, кафедра «Прикладная математика и информатика», РФ, г. Тольятти
Е-mail : barsukov2@gmail.com
Климов Виталий Сергеевич
научный руководитель, канд. тех. наук, доцент, РФ, г. Тольятти
Для контроля автомобильных потоков в коммерческих или правоохранительных целях часто требуется проводить распознавание автомобильных номеров движущихся объектов.
Решение данной задачи можно разделить на 3 этапа: выделение движущихся объектов; локализация на выделенных объектах номерных знаков; распознавание текста номерного знака [2; 3; 5].
Для каждого из данных этапов могут применяться различные алгоритмы искусственного интеллекта, нами же исследуется совместная работа алгоритмов, представленная в таблице 1.
Таблица 1.
Предложенные сочетания алгоритмов для организации системы распознавания автомобильных номеров
Этап |
Алгоритм |
Параметры работы алгоритма |
1. Выделение движущихся объектов |
k-means |
Количество кластеров — в зависимости от количества одновременно анализируемых объектов. Выбор метрики не оказывает значительного влияния на работу. |
2. Локализация номерных знаков |
Метод Виолы-Джонса |
Входные данные для обучения — общедоступная база данных изображений номерных знаков. |
3. Распознавание текста номерного знака |
Нейронная сеть Хэмминга |
Входные данные для обучения — по одному изображению для каждого символа применяемого в обозначении номерных знаков. Рекомендуемый размер матрицы входных нейронов — 10x20. |
Алгоритм работы системы распознавания номерных знаков:
1. Сравнение двух кадров сделанных с небольшим интервалом времени с одной и той же точки для поиска в двухмерном пространстве координат пикселей изменивших свое значение.
2. Запуск алгоритма: кластеризация k-means где входными данными являются координаты пикселей, найденные на предыдущем шаге. Количество кластеров выбирается равным из диапазона 5·N…6·N, где N — максимальное количество предполагаемых для наблюдения объектов.
3. Центры кластеров расположенные рядом друг с другом группируются, т. к. вероятней всего они относятся к одному объекту. Границами наблюдаемого объекта являются крайние координаты точек, найденные в шаге 1 и относящиеся (по результатам работы алгоритма k-means) к кластерам из данной группы (Рис. 1)
Рисунок 1. Результат выделения движущегося объекта с помощью алгоритма k -means. Крестами показаны центры кластеров. Рамкой показано объединение ближайших кластеров
4. Далее возможно распараллеливание вычисления для каждого найденного объекта.
5. С помощью метода Виолы-Джонса и общедоступной базы изображений номерных знаков проводится выделение у каждого объекта области соответствующей образу номерного знака (Рис. 2) [4].
Рисунок 2. Изображение, выделенное методом Виолы-Джонса
6. Затем проводится нормализация изображения путем трансформации до фиксированных размеров (Рис. 3а). Затем приведение изображения в двухцветный вид без использования градиентов серого (Рис. 3б).
Рисунок 3. Преобразование изображения в набор биполярных сигналов: а — нормализация изображения путем трансформации до фиксированных размеров; б — приведение изображения в двухцветный вид без использования градиентов серого
7. Так как положение символов на номерном знаке соответствуют государственному стандарту, то выделение символов из полученного изображения проводится путем отсчета от левого края изображения фиксированного количества пикселей (Рис. 4) [1].
Рисунок 4. Выделение символов путем отсчета от левого края изображения фиксированного количества пикселей
8. Полученные изображения трансформируются в набор биполярных сигналов, понятных для нейронной сети Хэмминга. Черный пиксель соответствует сигналу со значением “+1”, белый пиксель сигналу — “-1”.
9. Данный набор биполярных сигналов подается на вход нейронной сети Хэмминга, которая определяет каждый символ номерного знака по отдельности. Для обучения нейронной сети требуется по одному изображению для каждого символа применяемого в обозначении номерных знаков.
Список литературы:
1.ГОСТ Р 50577-93. Знаки государственные регистрационные транспортных средств. Типы и основные размеры. Технические требования. Введ. 1993-29-06. М.: Изд-во стандартов, 2002. — 33 с.
2.Block H.H. Clustering Methods: A History of k-Means Algorithms / H.H. Block // Selected Contributions in Data Analysis and Classification. Springer Berlin Heidelberg, 2007. — рр. 161—172.
3.Mirkin B. Core Concepts in Data Analysis: Summarization, Correlation and Visualization / Boris Mirkin. Springer London, 2011. — 390 p.
4.Viola P. Rapid Object Detection using a Boosted Cascade of Simple features / Paul Viola, Michael Jones. Accepted Conference on Computer Vision and Pattern Recognition, 2001. — 9 p.
5.Wu J. Advances in K-means Clustering : A Data Mining Thinking / Junjie Wu. Springer Berlin Heidelberg, 2012. — 180 р.
дипломов
Оставить комментарий