Information-theoretic analysis of efficiency of the phonetic encoding–decoding method in automatic speech recognition


Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

A words phonetic decoding method in automatic speech recognition is considered. The properties of Kullback–Leibler divergence are used to synthesize the estimation of the distribution of divergence between minimum speech units (e.g., single phonemes) inside a single class. It is demonstrated that the minimum variance of the intraphonemic divergence is reached when the phonetic database is tuned to the voice of a single speaker. The estimations are proven by experimental results on the recognition of vowel sounds and isolated words of Russian language.

Об авторах

V. Savchenko

Nizhny Novgorod State Linguistic University

Email: avsavchenko@hse.ru
Россия, ul. Minina 31a, Nizhny Novgorod, 603155

A. Savchenko

National Research University Higher School of Economics

Автор, ответственный за переписку.
Email: avsavchenko@hse.ru
Россия, Bol’shaya Pecherskaya ul. 25/12, Nizhny Novgorod, 603155

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Pleiades Publishing, Inc., 2016

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).