Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LXXXVII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 09 марта 2020 г.)

Наука: Технические науки

Секция: Технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Шиленков И.С. ЗАХВАТ И ОТСЛЕЖИВАНИЕ ОБЪЕКТОВ В ВИДЕОПОТОКЕ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. LXXXVII междунар. студ. науч.-практ. конф. № 3(86). URL: https://sibac.info/archive/technic/3(86).pdf (дата обращения: 09.01.2025)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ЗАХВАТ И ОТСЛЕЖИВАНИЕ ОБЪЕКТОВ В ВИДЕОПОТОКЕ

Шиленков Иван Сергеевич

студент кафедры ТиЗВ, Московский технический университет связи и информатики,

РФ, г. Москва

Балобанов Андрей Владимирович

научный руководитель,

доц., кафедра ТиЗВ, Московский технический университет связи и информатики,

РФ, г. Москва

АННОТАЦИЯ

На фоне активного применения электронно-вычислительных средств, обеспечивающих цифровую обработку изображений, отмечается существенное расширение функционала бытовых устройств, которые снабжены очень многими современными опциями, включая стабилизацию, настройку экспозиции в автоматическом режиме и даже отслеживание лица. В статье рассмотрен захват и отслеживание объектов в видеопотоке.

 

Ключевые слова: видеопоток, отслеживание, захват, алгоритм, устройство, математическая модель.

 

Решение подобных задач происходит в режиме реального времени. Кроме прочего, увеличиваются вычислительные мощности процессоров, благодаря чему сегодня разработчикам предоставляется отличная возможность реализации наиболее сложных алгоритмов. Также обеспечивается оснащение многих создаваемых устройств новым, принципиально отличным функционалом, который приближается по своим характеристикам к ожидаемому искусственному интеллекту. В любом случае фундаментальное базирование инновационной интеллектуальной обработки представлено захватом движения некоторых объектов в видеопотоке, а также их последующим высокоэффективным отслеживанием. С этой точки зрения простой захват объекта обозначается выделением области интересов в условиях цифрового изображения в определённый момент времени, а отслеживание – это захват на целой последовательности цифровых изображений [4].

Захват объекта в условиях реального времени представляет собой так называемый процесс обработки видеопотока с показателями минимальной частоты десять кадров в течение одной секунды. А обучение в этом плане следует рассматривать в качестве предварительной настройки и выставлении параметров алгоритма захвата и отслеживания для обнаружения необходимого объекта. Данный показатель осуществляется и базируется на обучающей выборке, включающей в себя одно или сразу несколько изображений обучающего типа, с наличием дополнительной информации, касающейся наличия или отсутствия требуемого объекта. Решать задачи по захвату и отслеживанию можно посредством огромного количества алгоритмов, направленных на проектирование актуального ПО для применения в самых разных сферах применения. Например, алгоритм Motion Templates представляет собой поиск границы объекта в абсолютно всех кадрах видеопотока. При этом смещением границ нового кадра по сравнению с предыдущим задаётся вектор перемещения объекта, чем обеспечивается максимальная эффективность при работе с наиболее крупными объектами и востребованность в распознании таких понятий, как жесты динамического типа в условиях человеко-машинных интерфейсов [1].

Для алгоритма Меаn-Shift характерна основа в виде математической модели, отличающейся вычислением локального экстремума плотности. При этом распределяется набор требуемых точек. Таким образом, данным алгоритмом отслеживается понятие, представленное смещением центральной части масс точек, которыми определяются все требуемые объекты слежения с получением на выходе векторной величины по движению объекта. Показатели эффективности в данном случае обеспечиваются ярко выраженным цветовым фоновым и объективным различием. К числу востребованных вариантов также относится непрерывно адаптирующийся сдвиг. При этом в алгоритме СаmShift присутствует достаточно характерная особенность, которая заключается в подстройке границ и размеров окна в автоматическом режиме с учётом расположения всех характерных точек. Также следует отметить, что в подобной ситуации пользователю будет гарантирована максимальная точность отслеживания объекта, который отличается достаточно заметными изменениями в плане размеров [3].

Метод Luсаs-Каnаdе базируется на таком ключевом понятии, как дифференциальное вычисление оптического потока посредством пиксельного анализа. Согласно этому методу, рассматривается аналогичность оптического потока в отношении пикселей, расположенных в центральной части окна для слежения. С этой точки зрения пиксельное смещение в соседних кадрах характеризуют незначительные показатели. Именно благодаря рассматриваемому алгоритму на протяжении почти четверти века осуществляется работа с приложениями для компьютерного зрения. Тем не менее, на сегодняшний день уже доказана максимальная эффективность применения данного метода с целью решения широкой области задач. В категорию достаточно востребованных и высокоэффективных отнесён также метод Violа-Jonеs, основа которого представлена выявлением в кадре пиксельного набора, соответствующего заблаговременно выбранным клише в виде стандартных прямоугольников белого и чёрного цвета. Различные объекты распознаются в процессе применения собственного, абсолютно уникального набора клише, создаваемого в результате обучения алгоритма в условиях конкретного объекта. Определённый минус в таком варианте – достаточно высокий уровень трудоёмкости, а также необходимость наличия у разработчика базовых теоретических знаний и навыков работы с подобными алгоритмами [5].

Как показывает практика, немаловажное значение имеет анализ используемых алгоритмов, направленных на захват и отслеживание объектов в условиях видеопотоков. Приступать к работе необходимо с инициализации стартовой области по слежению. С данной целью также вполне можно воспользоваться массивом характерных точек. Кроме прочего, существующие на сегодняшний день алгоритмы обеспечивают самостоятельное обнаружение искомого объекта в момент его появления в кадре. В некоторых случаях целесообразно указывать объект ручным способом или применять для этого передачу из функционала обнаружения координат или характерных точек. Следует отметить, что использование достаточно большого количества существующих в настоящее время алгоритмов предполагает прохождение обучающего процесса, чем определяются отчасти объективные показатели автономности, а также реальное удобство их практического применения для решения определённых или широкого круга задач. При этом с целью комплексного подхода к решению задач по отслеживанию объектов удалённого типа должна применяться пара алгоритмов – на процесс захвата и отслеживание [2].

Таким образом, вполне можно утверждать, что идеи и разработки в отношении получения так называемых автоматизированных методов определения места положения предметов или отслеживания их передвижения в видеопотоке являются в настоящее время актуальными, как некогда. В последнее время практикуется многоступенчатый подход к решению этой задачи, поэтому повышенное внимание часто уделяется изначальному обучению классификатору каскадного типа с последующей реализацией процесса распознавания и трекинга объектов. В этом случае ключевое значение имеет профессиональная разработка грамотного и эффективного программного обеспечения, соответствующего поставленным целям. Как показывает практика, для обучения целесообразно создавать специальную обучающую выборку, которая будет содержать достаточное количество, как позитивных, так и негативных изображений, что позволит получить несколько обученных классификаторов, различающихся важными параметрами. При этом показатели точности работы полученного классификатора должны быть, как минимум, удовлетворительными.

 

Список литературы:

  1. Алфимцев А.Н., Лычков И.И. Метод обнаружения объекта в видеопотоке в реальном времени. Вестник Тамбовского государственного технического университета, 2011, т. 17, № 1, с. 44–55.
  2. Baker S., Matthews I. Lucas – Kanade 20 Years On: A Unifying Framework. International Journal of Computer Vision — IJCV, 2004, vol. 56, no. 3, pp. 221–255.
  3. Comaniciu D., Meer P. Mean Shift: A Robust Approach Toward Feature Space Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence — PAMI, 2002, vol. 24, no. 5, pp. 603–619.
  4. Müller M., Röder T. Motion templates for automatic classification and retrieval of motion capture data. Symposium on Computer Animation — SCA. Vienna, Austria, 2006, pp. 137–146.
  5. Wang Z., Yang X., Xu Y., Yu S. CamShift guided particle filter for visual tracking. Pattern Recognition Letters — PRL, 2009, vol. 30, no. 4, pp. 407– 413.
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий