Тема: ИССЛЕДОВАНИЕ ПРОСТРАНСТВ ПРИЗНАКОВ И МЕР БЛИЗОСТИ В ЗАДАЧАХ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1.1 Современное состояние направления распознавания речевых сигналов 7
1.2 Особенности речеобразования и восприятия речи человеком 13
1.2.1 Речевой аппарат 13
1.2.2 Восприятие речевого сигнала человеком 16
1.3 Методы цифровой обработки сигналов в задачах распознавания
речевых сигналов 23
1.3.1 Спектральный анализ в базисе Фурье 24
1.3.2 Оконный анализ в базисе Фурье 25
1.3.3 Вейвлет анализ 28
1.3.4 Кепстральный анализ 32
1.4 Субполосный подход к обработке речевых сигналов 35
ГЛАВА 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ 37
2.1 Акустико-фонетический подход к распознаванию речевых сигналов .. 37
2.2 Вычислительные аспекты субполосного анализа речевых сигналов в
задачах идентификации 41
2.3 Исследование пространств признаков в задачах распознавания речевых
сигналов 47
2.3.1 Декомпозиция сигнала банком фильтров 47
2.3.2 Распределение мгновенных энергий отрезка РС 49
2.3.3 Распределение долей энергии отрезка РС 51
2.3.4 Распределение информационных интервалов отрезка РС 53
2.3.5 Частота переходов через ноль 55
2.3.6 Ширина частотной области, занимаемая сигналом 59
2.3.7 Мел-кепстральные коэффициенты речевого сигнала 63
2.4 Меры близости в задачах распознавания речевых сигналов 66
2.4.1 Евклидово расстояние 66
2.4.2 Среднеквадратическое отклонение 67
2.4.3 Расстояние Махаланобиса 67
2.4.4 Корреляция последовательностей 68
2.4.5 Динамическая трансформация временной шкалы 69
ГЛАВА 3 ИССЛЕДОВАНИЕ ПРИГОДНОСТИ ПРЕДСТАВЛЕНИЙ
РЕЧЕВЫХ СИГНАЛОВ В ЗАДАЧАХ РАСПОЗНАВАНИЯ 72
3.1 Методика оценки методов распознавания речевых сигналов 72
3.2 Исследование подходов к распознаванию речевых сигналов 78
ЗАКЛЮЧЕНИЕ 87
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 89
📖 Введение
В настоящий момент, повсеместно, ведутся работы по созданию систем обработки устной речи, среди которых особенное место занимает распознавание речи. Система распознавания речи получает информацию об акустических колебаниях воздуха через микрофон, сравнивает полученные данные с имеющимися в системе и, в случае совпадения идентифицирует участок сигнала. Для учета вариативности и обучения моделей фонем и слов требуются большие объемы текста и речевого материала, подготовка которых требует огромных трудозатрат. Современные системы распознавания обучения на ограниченных речевых корпусах обладают рядом недостатков.
Сегодня существуют два основных вида технологий распознавания речи. Один из них — это распознавание речи, зависящей от диктора, т. е. пользователь должен сначала научить систему распознавать его голос, и только после этого система может функционировать. Второй — это распознавание речи, не зависящее от диктора, т. е. система способна распознать любую речь, независимо от того, кто говорит. Системы распознавания изолированных слов работают с дискретными словами — в этом случае требуется пауза между словами.
Существующие системы распознавания созданы для работы с английским, немецким, испанским и другими популярными языками и малоприменимы в работе с русской речью. Это связано с тем, что русский язык принципиально отличается от других языков не только фонетически, но и свободным порядком слов в предложении, что значительно усложняет математическое языковой модели. Важной задачей при разработке систем распознавания речи, является выделение таких признаков, которые бы обладали 1) свойством инвариантности на отрезках, полученных при произнесении одних и тех же звуков русской речи, 2) и вариативности на отрезках, содержащих разные звуки. Кроме того, требуются подходы к сравнению данных признаков - т.е. определение адекватных мер близости.
В основе многих из разработанных подходов [25,26,49,50] используются частотные представления, так как порождаемые звуками речи отрезки РС обладают свойством концентрации энергии в достаточно узких полосах частотной оси. В связи с этим можно упомянуть рассматриваемое в литературных источниках разбиение частотной полосы на так называемые критические полосы слуха, которые опосредованно отражаются на частотных свойствах РС.
Необходимо отметить, что предлагаемые в настоящее время методы распознавания РС на основе анализа их частотных свойств, в качестве признакового пространства, либо не отражают свойства концентрации энергии, либо недостаточно точно отображают характер изменения энергии в речевом сигнале.
Целью работы является определение важных, с точки зрения решения задачи распознавания речи - признаков речевых сигналов и мер их близости.
1. Для достижения цели необходимо решить следующие задачи:
2. Проанализировать особенности обработки речевых сигналов в задачах распознавания речи;
3. Изучить существующие методы представления речевых сигналов в задачах распознавания и провести их сравнительный анализ;
4. Изучить меры близости, применяемые для сравнения признаков речевых сигналов в системах распознавания речи;
5. Определить важные характеристики речевого сигнала.
для задачи распознавания речи
✅ Заключение
Проведен анализ особенностей обработки речевых сигналов в задачах распознавания речи: приведены концептуальные схемы распознавания, даны сведения о восприятии и воспроизведении звука человеком. Изучены существующие методы представления речевых сигналов в задачах распознавания: частотные (например, частотное распределение) и временные (например, частота перехода сигнала через ноль) представления, проведен их сравнительный анализ. Для получения некоторых признаков (декомпозиция сигнала по банку фильтров, распределение мгновенных энергий, распределение долей энергии, распределение информационных интервалов) использовался субполосный подход, который позволяет точно выделять распределение долей энергий по частотным интервалам с минимальным просачиванием.
Изучены меры близости, применяемые для сравнения признаков: евклидово расстояние, среднеквадратическое отклонение, расстояние Махаланобиса, корреляция, динамическая трансформация временной шкалы. Наиболее подходящими для задач распознавания речевых сигналов являются:
динамическая трансформация временной шкалы; среднеквадратическое отклонение; евклидово расстояние.
Проведен сравнительный анализ применения различных мер близости и векторов признаков который показал, что наиболее пригодными, для задач



