Статья опубликована в рамках: CXLII Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 06 июня 2022 г.)
Наука: Технические науки
Секция: Радиотехника, Электроника
Скачать книгу(-и): Сборник статей конференции
дипломов
МЕТОДЫ КОДИРОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ
SPEECH CODING METHODS
Stanislav Altynbaev
undergraduate, Department of Radioelectronic Control Systems, Baltic State Technical University. D.F. Ustinova,
Russia, St. Petersburg
Kirill Aleshin
undergraduate, Department of Radioelectronic Control Systems, Baltic State Technical University. D.F. Ustinova,
Russia, St. Petersburg
АННОТАЦИЯ
В данной статье рассмотрены методы кодирования речевых сигналов. Описан распространенный алгоритм CELP. Изучены методы анализа декодера.
ABSTRACT
This article discusses methods for encoding speech signals. Described one of the most popular algorithms CELP. Studied are methods analysis decoder.
Ключевые слова: кодирование речевых сигналов; стандарт TETRA; алгоритм CELP.
Keywords: speech coding; TETRA standard; CELP algorithm.
Общение абонентов зачастую происходит на фоне шумов: сирен, дорог, людей. Встает актуальная проблема в обеспечение в подобных обстановках четкость речи, его малое искажение и большую мощность выходного аудиосигнала. Такое качество может обеспечивать использование кодека TETRA. Кодирование речевых сигналов в стандарте TETRA происходит благодаря кодера на методе линейным предсказанием с многоимпульсным кодовым возбуждением CELP (Code Excited Linear Prediction).
Рассмотрим принцип работы речевого кодека детальнее. Наибольшее распространение получила линейная авторегрессионная тип процесса формирования речевых сигналов с периодичностью 10-30 миллисекунд характеристиками. Для этой модели:
(1)
где М - порядок модели, s(n) - набор отсчетов речевого сигнала, a(m) - параметр линейного предсказания, а x(n) - формирующая последовательность. Авторегрессионная тип речевого сигнала дает право применять развитый математический аппарат линейного прогнозирования и описывает его с достаточно высокой степенью вероятности. Таким образом, в модели (1) обеспечивается устойчивость к входному акустическим помехам и дефектам в канале связи, а также более высокое качество декодирования речи, чем в системах, основанных на иных принципах кодирования.
В контексте данной модели наиболее подающие большие надежды являются системы кодирования через синтез с использованием многоимпульсного возбуждения от кода. Актуальность возбуждения [3] сводиться к тому, что в остатке сигнала линейного предсказания выбираются значения, которые необходимы для увеличения качества синтезированной речи. Таким образом применяемая модель кодирования в процедуре анализа через синтез без учета дефектов квантования, включает условия субъективной оценки качества речевого сигнала и таким образом обеспечивает натуральное звучание синтезированной речи.
Для устройства кодирования используется декодер речевого сигнала. Задача которого в анализе оценки передаваемых в канал связи параметров речевых сигналов. Для определения критерии оценки используется взвешенная по частоте квадратическая ошибка:
(2)
где S(f) и Sq(f) - преобразование Фурье начальных и преобразованных речевых сигналов, а W(f) - весовая функция.
Этолом была предложена весовая функция следующего вида
(3)
где A-1(z) - синтезирующий фильтр, а - параметр, регулирующий шум дискретизации.
Для повышения эффективности используется уплотнение речевых сигналов в алгоритмах кодирования. Уплотнение происходит за счет сокращения избыточности последовательности x(n) с синтезирующем фильтром А-1(z) линейного предсказания, с коэффициентом передачи:
(4)
В соотношении от способа описания сигнала x(n), попадающей на вход фильтра, можно подчеркнуть алгоритмы кодирования c возбуждением последовательности импульсов, с самовозбуждением и с возбуждением от кода (CELP). Наиболее высокое качество декодирование речи [1] обеспечивает кодовое возбуждение по сравнению с другими алгоритмами. Данный метод чаще всего использовался при трансляции речевого сигнала в диапазоне скоростей от 4 до 16 Кбит/с.
Структурная схема передающей (а) и приемной (б) частей CELP-кодера показана на рисунке 1.
Рисунок 1. Структурная схема передающей и приемной частей CELP-кодера
В алгоритме CELP осуществляются векторная дискретизация последовательности x(n), то есть положения амплитуды и их импульсов в сигнале многоимпульсного возбуждения преобразовывается одновременно. Исходя из этого сегмент сигнала возбуждения выбирается из заранее сформированной постоянного набора - кодовой книги, содержащей вполне большое количество реализаций, например, некоррелированного гауссовского шума. Выбранная реализация усиливается и поступает на [2] вход цепочки фильтра (4). В канал связи передаются индекс элемента кодовой книги с показателем усиления, свойства синтезатора основного тона, а также показатели линейного предсказания, определяющие состояние голосового канала.
Рассмотрели методы кодирования речевых сигналов. Описали распространенный алгоритм CELP. Изучили методы анализа декодера.
Список литературы:
- Помехоустойчивость и эффективность систем передачи информации. Зюко А.Г., Фалька А.И., Панфилов И.П. и др.; под ред. Зюко А.Г. - М.: Радио и связь, 1985. - 272 с.
- Элементы теории передачи дискретной информации. /Под ред. Л.П. Пуртова. - М.: Связь, 2012. - 428 с.
- Венскаускас И.К., Малахов Л.М. Импульсные помехи и их воздействие на системы радиосвязи// Зарубежная радиоэлектроника. - 2018. - No1. - с. 95-125.
дипломов
Оставить комментарий