Whispered speech recognition based on gammatone filterbank cepstral coefficients


Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

This paper presents the results on whispered speech recognition using gammatone filterbank cepstral coefficients for speaker dependent mode. The isolated words used for this experiment are taken from the Whi-Spe database. Whispered speech recognition is based on dynamic time warping and hidden Markov models methods. The experiments are focused on the following modes: normal speech, whispered speech and their combinations (normal/whispered and whispered/normal). The results demonstrated an important improvement in recognition after application of cepstral mean subtraction, especially in mixed train/test scenarios.

Об авторах

B. Marković

Telecommunication Department, School of Electrical Engineering

Автор, ответственный за переписку.
Email: brankomarko@yahoo.com
Сербия, Belgrade, 11000

J. Galić

Telecommunication Department, School of Electrical Engineering

Email: brankomarko@yahoo.com
Сербия, Belgrade, 11000

Ð. Grozdić

Telecommunication Department, School of Electrical Engineering

Email: brankomarko@yahoo.com
Сербия, Belgrade, 11000

S. Jovičić

Telecommunication Department, School of Electrical Engineering

Email: brankomarko@yahoo.com
Сербия, Belgrade, 11000

M. Mijić

Telecommunication Department, School of Electrical Engineering

Email: brankomarko@yahoo.com
Сербия, Belgrade, 11000


© Pleiades Publishing, Inc., 2017

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах