|

Сравнение различных критериев сегментации для выделения участков речевых сигналов во временной области

Авторы: Жукова А.Б., Масленников А.Л.
Опубликовано в выпуске: #2(31)/2019
DOI: 10.18698/2541-8009-2019-2-436


Раздел: Информатика, вычислительная техника и управление | Рубрика: Системный анализ, управление и обработка информации, статистика

Ключевые слова: распознавание речи, голосовое управление, сегментация речевого сигнала, критерий сегментации, фильтр Савицкого — Голея, фильтр скользящего среднего, скользящая дисперсия, выделение участков речевых сигналов

Опубликовано: 07.02.2019

Распознавание речи — сложная техническая задача, над решением которой работают многие ученые и коммерческие компании. Решение этой задачи во временной области, как правило, требует предварительной сегментации речевого сигнала, т. е. выделения участков речевых сигналов, соответствующих словам, слогам или фонемам. Для этого вводят критерии сегментации, связанные с мощностью или с частотой изменения речевого сигнала на некотором интервале времени. Критерии сегментации могут быть сформулированы по-разному, что отражается в первую очередь на сложности их алгоритмической реализации и объеме требуемых вычислительных ресурсов. В статье выполнено сравнение нескольких критериев сегментации при выделении участков речевых сигналов, соответствующих отдельным словам.


Литература

[1] Плотников В.Н., Суханов В.А., Жигулевцев Ю.Н. Речевой диалог в системах управления. М., Машиностроение, 1988.

[2] Рабинер Л.Р., Шафер Р.В. Цифровая обработка сигналов. М., Радио и связь, 1981.

[3] Сапожков М.А. Речевой сигнал в кибернетике и связи. М., Связьиздат, 1963.

[4] Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев, Наукова думка, 1987.

[5] Алимурадов А.К., Чураков П.П. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи. Измерение. Мониторинг. Управление. Контроль, 2015, № 2(12), с. 27–35.

[6] Сорокин В.Н., Цыплихин А.И. Сегментация и распознавание гласных. Информационные процессы, 2004, т. 4, № 2, с. 202–220.

[7] Цыплихин А.И., Сорокин В.Н. Сегментация речи на кардинальные элементы. Информационные процессы, 2006, т. 6, № 3, с. 177–207.

[8] Savitzky A., Golay M.J.E. Smoothing and differentiation of data by simplified least squares procedures. Anal. Chem., 1964, vol. 36, no. 8, pp. 1627–1639. DOI: 10.1021/ac60214a047 URL: https://pubs.acs.org/doi/10.1021/ac60214a047

[9] Savitzky A. A historic collaboration. Anal. Chem., 1989, vol. 61, no. 15, pp. 921A–923A. DOI: 10.1021/ac00190a003 URL: https://pubs.acs.org/doi/10.1021/ac00190a003

[10] Steinier J., Termonia Y., Deltour J. Smoothing and differentiation of data by simplified least square procedure. Anal. Chem., 1972, vol. 44, no. 11, pp. 1906–1909. DOI: 10.1021/ac60319a045 URL: https://pubs.acs.org/doi/10.1021/ac60319a045