Статья опубликована в рамках: LXXIII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 17 января 2019 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
РАСПОЗНАВАНИЕ РЕЧИ В АВТОМОБИЛЬНОЙ СРЕДЕ
Статистика показывает, что молодые водители во время вождения используют мобильные устройства без аксессуаров (наушники, блютуз гарнитура). Это в свою очередь влияет на их восприятие дорожного движения.
Наличие вычислительной мощности компьютера и сетевого подключения в автомобилях и мобильных устройств привело к использованию доступных приложений и сервисов для пользователей. Одним из возможных способов работы с мобильным устройством во время движения является использование функции распознавания речи.
Автомобильная среда является одной из самых сложных сред для распознавания речи. В таких случаях важно уменьшить визуальное и физическое взаимодействие водителя из - за потенциальных помех, таких как пассажиры автомобиля и их разговор, фоновая музыка или подобные фоновые шумы (ветер, звук стеклоочистителей и т.д.). По этим и аналогичным причинам производители автомобилей и оборудования инвестируют в улучшение и оптимизацию приложений для распознавания речи, адаптированных к конкретной среде автомобиля. Учитывая вышесказанное, установлены высококачественные микрофоны в автомобиле, а также технология, позволяющая снизить уровень шума. Применения улучшаются, используя акустическую окружающую среду, которая специфически для окружающей среды автомобиля.
Речь является одной из естественных возможностей взаимодействия человека с машиной. Возможности распознавания речи все больше развиваются и используются в автомобильной промышленности. Вышесказанное неудивительно, учитывая, что конкурентоспособность на рынке современных автомобилей во многом зависит от их технических особенностей и инноваций.
Таким образом, развитие распознавания речи в автомобильной промышленности основывается на следующих областях:
- голосовые указания;
- использование навигационных систем
- взаимодействие бортовой системы автомобиля (включение радио, вкл/выкл кондиционера и т.д.).
Умные устройства становятся все более популярными с развитием сегмента оборудования, а также новых функций, которые являются результатом использования все большего числа датчиков. Одним из важных применений смартфонов является возможность распознавания речи и обработки этой информации/команд.
Разработка приложений для современных смартфонов имеет большой потенциал. В связи со спецификой отдельных мобильных операционных систем разрабатываются разнообразные приложения, позволяющие в той или иной степени реализовать хотя бы часть функций распознавания речи. Целью этих решений является разработка программного решения, которое сможет использовать человеческую речь.
Транснациональные компании, такие как Apple и Google, признали важность таких приложений и одними из первых предложили комплексные решения. Применение Siri в данном случае являлось фундаментальным подходом к поставленной задаче. Она была предложена для большого количества пользователей по всему миру [1].
Возможности применения распознавания речи с помощью мобильных терминальных устройств могут быть разнообразными, при этом наиболее важные варианты использования приведены на рисунке 1. Указанные варианты использования могут быть выполнены в любом из двух режимов, независимо от того, работает ли распознавание речи непосредственно на терминальном устройстве или выполняется на сервере [2].
Рисунок 1. Наиболее распространенные случаи использования приложения распознавания речи в автомобиле
Рисунок 1 дает представление о возможных сценариях использования смартфонов в автомобиле при помощи речи. Учитывая вышесказанное, можно выделить следующие важнейшие характеристики и возможности использования смартфонов:
- голосовой поиск - поиск информации, хранящейся на мобильном устройстве;
- голосовой вызов;
- интернет поиск необходимой информации с помощью голосовых команд в браузере мобильного устройства;
- преобразование голоса в текст;
- воспроизведение голоса - возможность прослушать полученное в текстовом формате сообщение, при этом сообщение автоматически воспроизводится с помощью голоса
- поиск сообщений – возможность использования голоса при поиске информации в определенных сообщений (SMS-сообщений, напоминаний, календаря, сообщений электронной почты);
- календарь / напоминания - добавление / удаление / редактирование заметок и обязательств, связанных с календарем мобильного устройства, с помощью голоса
- прослушивание прогноза погоды;
- доступ к мультимедиа – устройство, которое обеспечивает воспроизведение мультимедийных данных (видео-файлы, музыкальные файлы, фотогалерея и т. д.) [3].
Современные системы голосового управления успешно справляются с разговорным языком, различными диалектами, альтернативными формулировками, индивидуальными особенностями произношения и быстротой речи. Для повышения качества распознавания команд используется фильтр шумов, отсекающий ненужные звуки [4].
Список литературы:
- Материал с сайта «INC». Раздел «Who's Smartest: Alexa, Siri, and or Google Now?» [Электронный ресурс]. URL: https://www.inc.com/kevin-j-ryan/internet-trends-7-most-accurate-word-recognition-platforms.html (дата обращения: 7.10.2018).
- Материал с сайта «Globalme». Раздел «Speech Recognition Technology Overview» [Электронный ресурс]. URL: https://www.globalme.net/blog/the-present-future-of-speech-recognition (дата обращения: 30.10.2018).
- Материал с сайта «Globalme». Раздел «Speech Recognition Technology Overview» [Электронный ресурс]. URL: https://www.globalme.net/blog/the-present-future-of-speech-recognition (дата обращения: 30.10.2018).
- Материал с сайта «Systemsauto». Раздел «Система голосового управления» [Электронный ресурс]. URL: http://systemsauto.ru/another/voice-control-system.html (дата обращения: 17.12.2018).
дипломов
Оставить комментарий