Статья опубликована в рамках: XXXVII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 24 декабря 2015 г.)
Наука: Технические науки
Секция: Моделирование
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
дипломов
АНАЛИЗ ПОДХОДОВ К СОЗДАНИЮ БЕСКОНТАКТНЫХ ИНТЕРФЕЙСОВ
Зенг Валерия Андреевна
студент 1 курса, кафедра «Дизайн и технологии медиаиндустрии» ОмГТУ,
РФ, г. Омск
Е-mail: valeriyazeng@mail.ru
Батенькина Оксана Васильевна
научный руководитель, канд. техн. наук, доцент ОмГТУ,
РФ, г. Омск
На сегодняшний день большое значение приобретают новые как в программном, так и в концептуальном плане формы взаимодействия человека и ЭВМ, требующие создания новых типов интерфейсов, в которых не используются панели инструментов, а, при настройке спецификаций и операций акцент падает на распознавание речи и жесты [1].
Быстрое развитие бесконтактных технологий является в настоящее время одним из главных направлений, определяющих сценарии становления и перспективы мировой индустрии. Создание удобного и доступного бесконтактного человеко-машинного интерфейса требует применения методик и технологий, способных обеспечить данные свойства [2].
На данный момент существуют несколько вариантов взаимодействия с устройствами без прикосновения к ним:
1. технология управления голосом;
2. технология управления взглядом;
3. технология управления жестами/движениями рук;
4. технология захвата (отслеживания) движения тела.
Распознавание речи – процесс преобразования речевого сигнала в цифровую информацию. Все многообразие существующих систем распознавания речи можно условно разделить на определенные группы.
Распознавание отдельных команд заключается в четком произнесении и следующим за ним распознаванием отдельного слова или словосочетания из заранее установленного словаря. Точность распознавания напрямую связана с составом заданного словаря. Его соблюдать эти условия, то эта технология дает возможность высокоточного распознавания.
Распознавание по грамматике состоит в распознавании фраз, которые соответствуют установленным правилам. Для установки грамматик применяются XML-языки, обмен данными между приложением и системой распознавания обычно реализовывается по протоколу MRCP.
Поиск ключевых слов в потоке слитной речи осуществляет распознавание отдельных участков речи. В этой системе речь может быть как спонтанной, так и отвечающей заданным правилам. Такая речь превращается в текст не вся – в ней сразу же распознаются только те участки, которые включают определенные отдельные слова и словосочетания.
Технология распознавания слитной речи на большом словаре наиболее близка реализации полноценного человеко-машинного взаимодействия – все сказанное в точности преобразуется в текст. Задача дословного распознавания слитной речи пока что не решена нигде, но достоверность такого распознавания вполне высока для возможности использования этой технологии в быту [4].
Как видно, технологии речевого распознавания нашли свое применение в различных областях. Однако в данной области множество проблем все еще остаются не решенными, многие идеи требуют дальнейшего развития. Задача распознавания слитной речи в достаточной степени не решена, хотя в случае ограниченного словаря системы показывают высокоточные результаты [5].
В последние годы на рынке появились множество бюджетных бесконтактных устройств ввода, подчиняющихся человеческому взгляду, ориентированных главным образом на людей с ограниченными возможностями. Однако они получили применение в играх, смартфонах, цифровых фотоаппаратах и прочей бытовой технике.
Действительно, большинство пользователей крайне скептически относятся к бесконтактным интерфейсам типа голосового управления и прочих инноваций подобного типа. Между тем, управление взглядом не только быстро, удобно, но ещё и чрезвычайно надежно. В правильно спроектированной и должным образом реализованной системе, процент ложных срабатываний стремится к минимуму [2]. Смещение зрачка относительно центра глаза сразу же регистрируется видеокамерой с любым линейным разрешением и легко обрабатывается различной мощности микропроцессорами (рис. 1).
Рисунок 1. Управление взглядом на симуляторе полётов
Пользователь может бродить по Интернет, не отрываясь от чашки кофе, переворачивать страницы электронных книг, раскладывать пасьянс или даже играть в динамичные игры. Автокалиброка занимает доли секунды, однако в игре этого времени вполне достаточно для того, чтобы из-за внезапного поворота событий пользователь потерял игровые баллы [6].
Одной из наиболее популярных и востребованных систем бесконтактного взаимодействия является технология управления движением рук. Концепция новых естественных интерфейсов позволяет управлять компьютером при помощи естественных движений пальцев. Простые инфракрасные датчики следят за движениями рук пользователя с беспрецедентной (до 0,01 мм) точностью и воспроизводят их на экране. Главной деталью этой технологии является совершенное программное обеспечение, которое создает трехмерную модель рук и позволяет переносить их движение в виртуальную среду. Датчики можно установить на любой монитор или просто на стол, стену – если работа идет с виртуальными очками.
Наиболее перспективными системами бесконтактного взаимодействия являются технологии, развивающиеся в системах захвата движения. Существуют два основных вида систем захвата движения: маркерные, в которых используется специальное оборудование, и безмаркерные системы захвата.
В маркерных системах захвата движения камеры фиксируют данные с костюма с датчиками, одетыми на предмет, после чего те поступают в компьютер, где из них формируется единая трёхмерная модель, воспроизводящая движения предмета. Согласно этой модели в реальном времени или после съемки создаётся анимация виртуального предмета. Эта технология больше подходит для создания основы трёхмерной анимации, а не для бесконтактного управления.
Безмаркерные технологии (рис. 2) не нуждаются в таких специальных датчиках, они базируются в основном на технологии распознавания образов. В связи с этим отслеживание и распознавание движений является потенциальной возможностью для людей в обычной одежде, без специальных приспособлений, а это, в свою очередь, расширяет область использования таких технологий [3].
Рисунок 2. Безмаркерная системы захвата движения компании iPi Soft
Применение сенсоров-дальномеров, которые являются отличительной особенностью систем захвата движения, значительно упрощает порядок основных задач компьютерного зрения, используемых в безмаркерных технологиях, в том числе отсечение фона и разделение объектов изображения. В результате, обе системы являются менее затратными в плане ресурсов и обеспечивают возможность осуществления захвата движения в реальном времени. Помимо этого, использование сенсоров-дальномеров позволяет сократить количество камер, используемых во время захвата движения.
Исходя из вышеперечисленных особенностей каждой системы бесконтактного взаимодействия, наиболее перспективными системами для создания бесконтактных интерфейсов являются технология управления жестами и безмаркерная технология захвата движения. Обе эти системы хорошо зарекомендовали себя в технологиях бесконтактного управления, также эти устройства открывают широкие возможности для разработки программного обеспечения, такого как прикладные программы или интерфейсы.
Список литературы:
- Акимов Д.А. К вопросу создания бесконтактных средств управления большими массивами данных в эргатических системах. / Д.А. Акимов, Т.Ю. Морозова. – М.: Авиакосмическое приборостроение, – 2013. – № 5. – с. 46–56.
- Котюжанский Л.А. Интерфейс бесконтактного управления. М.: Фундаментальные исследования, – 2013. – № 4–1. – с. 44–48.
- Котюжанский Л.А. Универсальная система распознания образов – структура, обучение и тестирование системы // Отчетная конференция молодых ученых: науч. труды XIV отчетной конф. молодых ученых УГТУ-УПИ: сб. статей. – Екатеринбург: УГТУ-УПИ, – 2008. – ч. 3., – с. 297–300.
- Методы автоматического распознавания речи: в 2-х книгах. Пер. с англ. / Под ред. У. Ли. – М.: Мир, 2003. – Кн. 1. – 328 с.
- Чекмарев А. Речевые технологии – проблемы и перспективы. СПб.: Компьютерра,– 2007 – № 49. – с. 26–43
- 6. Ярбус А.Л. Роль движения глаз в процессе зрения. М.: Наука, 2007. – 167 с.
дипломов
Оставить комментарий