Статья опубликована в рамках: Научного журнала «Студенческий» № 23(151)
Рубрика журнала: Технические науки
Секция: Электротехника
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
МАШИННОЕ ЗРЕНИЕ В СРЕДЕ MATHLAB
АННОТАЦИЯ
Представлен обзор на машинное зрение в среде Mathlab и обзор его возможностей.
ABSTRACT
An overview of machine vision in the Mathlab environment and an overview of its capabilities are presented.
Ключевые слова: машинное зрение, изменение, Mathlab, веб камера, обзор возможностей.
Keywords: machine vision, change, Mathlab, webcam, overview of features.
Техническое зрение - это теория и технология создания машин, которые могут обнаруживать, отслеживать и классифицировать объекты. Машинное зрение в первую очередь ориентировано на промышленные приложения, такие как автономные роботы и системы визуального контроля и измерения. Это означает, что технологии датчиков изображения и теории управления связаны с обработкой видеоданных для управления роботом, а обработка полученных данных в реальном времени выполняется программно или аппаратно.
Обработка и анализ изображений в основном сосредоточены на работе с 2D-изображениями, то есть на том, как преобразовать одно изображение в другое. Например, операции попиксельного повышения контрастности, операции улучшения границ, операции шумоподавления или геометрические преобразования, такие как поворот изображения. Эти операции предполагают, что обработка / анализ изображений работает независимо от содержания самих изображений. На рисунке 1 показан пример уменьшения шума на изображении.
Рисунок 1. Устранение шумов на изображении
Компьютерное зрение сосредотачивается на обработке трехмерных сцен, спроектированных на одно или несколько изображений. Например, восстановлением структуры или другой информации о 3D сцене по одному или нескольким изображениям. Компьютерное зрение часто зависит от более или менее сложных допущений относительно того, что представлено на изображениях. Компьютерное зрение фокусируется на обработке трехмерных сцен, проецируемых на одно или несколько изображений. Например, восстановление структуры или другой информации о 3D-сцене для одного или нескольких изображений. Компьютерное зрение часто зависит от более или менее сложных предположений о том, что изображено на изображениях.
Также существует область, называемая визуализацией, которая изначально была связана с процессом создания изображения, но иногда занималась обработкой и анализом. Например, рентгенография работает с анализом видеоданных для медицинского использования.
Наконец, распознавание изображений - это область, в которой используются различные методы для получения информации из видеоданных, в основном на основе статистического подхода. Большая часть этой области посвящена практическому применению этих методов. На рисунке 2 показан пример определения расстояния до объекта.
Рисунок 2. Определение расстояния до объекта
Таким образом, можно сделать вывод, что понятие «машинное зрение» сегодня включает в себя: компьютерное зрение, распознавание визуальных образов, анализ и обработку изображений и т.д.
Расчет расстояния до объекта важен, так как необходимы роботизированные устройства, а зрение человека для распознавания и отслеживания объектов в космосе обусловлено бинокулярным зрением или стереосистемой.
Стереозрение - тип зрения, при котором можно воспринимать форму, размер и расстояние до объекта, например, благодаря бинокулярному зрению.
Основа стереозрения - бинокулярное зрение, а также используются 2 камеры, выполняющие роль глаз в автомобиле. На рисунке 3 показан пример стереозрения.
Рисунок 3. Пример работы стереозрения
С помощью алгоритмов фотограмметрии можно оценить расстояние до анализируемой сцены и получить трехмерную модель окружающей среды в реальном времени с использованием изображений с двух камер. Основной задачей при разработке таких систем является процедура калибровки видеокамер, которые представляют собой стереопару, поскольку могут возникнуть проблемы с точностью соотношения двух камер относительно друг друга и внутренними настройками камеры. что приведет к искажению изображения. Задача оценки структуры сцены - определение координат точек в пространстве. Необходимо рассчитать параметры камер и, используя метод триангуляции, в соответствии с рисунком 4 определить взаимосвязь между двумя изображениями.
Рисунок 4. Метод триангуляции
На рисунке 4 два снимка одной сцены получены с разных точек проекций. Пусть дана точка в пространстве и известны две камеры с центрами проекцийO1, O2, на которых измерены точки м1, м2, являющиеся образами одной и той же точки пространства М. Для вычисления координат точки М, м1и м2 ставим в соответствие лучи, и так как обычно они не пересекаются, то ищем общий перпендикуляр и среднюю точку, применяя метод средней точки.
Список литературы:
- Computer Vision System Toolbox – компьютерное зрение для Simulink. URL: http://matlab.ru/products/computervision-system-toolbox.
- Matlab и Simulink – сообщество пользователей, материалы, книги, форум. URL: http://matlab.exponenta.ru.
- Dalal N., Triggs B. Histograms of Oriented Gradients forHuman Detection // INRIA, 2005. URL: http://lear.inrialpes.fr/pubs/2005/DT05/hog_cvpr2005.pdf.
Оставить комментарий