ВЛИЯНИЕ ЭМОЦИЙ НА ХАРАКТЕРИСТИКИ РЕЧЕВОГО СИГНАЛА
|
ВВЕДЕНИЕ 3
ГЛАВА 1 ОПИСАНИЕ ХАРАКТЕРИСТИК И ПРИЗНАКОВ РЕЧЕВОГО
СИГНАЛА 5
1.1 Характеристики речевого сигнала 5
1.2 Признаки ЭОР 10
1.2.1 Спектрально-временные признаки 10
1.2.2 Кепстральные коэфффициенты 12
1.2.3 Амплитудно-частотные признаки 15
1.2.4 Признаки нелинейной динамики 17
ГЛАВА 2 ЛИНЕЙНЫЕ ХАРАКТЕРИСТИКИ РЕЧИ ХАРАКТЕРИЗУЮЩИЕ
ЭМОЦИОНАЛЬНОЕ СОСТОЯНИЕ 20
2.1 Линейные характеристики речи 20
2.1.1 Частоты основного тона 21
2.1.2 Громкость речи 24
2.1.3 Паузы 24
ГЛАВА 3 ИССЛЕДОВАНИЕ ЛИНЕЙНЫХ ХАРАКТЕРИСТИК
ОЦЕНИВАЮЩИХ ЭМОЦИОНАЛЬНУЮ ОКРАСКУ ЗВУКОВ 26
3.1 Подготовка речевых данных 26
3.2 Исследование параметра частоты основного тона 32
3.3 Исследование количества пауз 39
3.4 Исследование громкости речевого сигнала 41
ЗАКЛЮЧЕНИЕ 44
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ГЛАВА 1 ОПИСАНИЕ ХАРАКТЕРИСТИК И ПРИЗНАКОВ РЕЧЕВОГО
СИГНАЛА 5
1.1 Характеристики речевого сигнала 5
1.2 Признаки ЭОР 10
1.2.1 Спектрально-временные признаки 10
1.2.2 Кепстральные коэфффициенты 12
1.2.3 Амплитудно-частотные признаки 15
1.2.4 Признаки нелинейной динамики 17
ГЛАВА 2 ЛИНЕЙНЫЕ ХАРАКТЕРИСТИКИ РЕЧИ ХАРАКТЕРИЗУЮЩИЕ
ЭМОЦИОНАЛЬНОЕ СОСТОЯНИЕ 20
2.1 Линейные характеристики речи 20
2.1.1 Частоты основного тона 21
2.1.2 Громкость речи 24
2.1.3 Паузы 24
ГЛАВА 3 ИССЛЕДОВАНИЕ ЛИНЕЙНЫХ ХАРАКТЕРИСТИК
ОЦЕНИВАЮЩИХ ЭМОЦИОНАЛЬНУЮ ОКРАСКУ ЗВУКОВ 26
3.1 Подготовка речевых данных 26
3.2 Исследование параметра частоты основного тона 32
3.3 Исследование количества пауз 39
3.4 Исследование громкости речевого сигнала 41
ЗАКЛЮЧЕНИЕ 44
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Эмоционально окрашенная речь (ЭОР) применяется в многочисленных сферах человеческой деятельности и играет роль в функциях систем автоматизированного управления федеральной службы безопасности (ФСБ), реабилитации пациента и срочного оповещения для предотвращения неприятных ситуаций, а возможно даже катастрофических. Уже давно есть интерес к анализу речевого сигнала (РС) как действительного показателя эмоционального состояния (ЭС) человека, выполняющего ответственную роль космонавта, летчика, оператора АЭС, диспетчера аэропорта, психолога, сотрудника спецслужб и т.д. Проблема автоматического распознавания эмоционального состояния звуков на данный момент не решена полностью, в связи с отсутствием модели описания речевых образцов в условиях проявления различных видов эмоций.[3] ЭОР должна отражать взаимосвязь вида эмоций и объективных характеристик РС. На настоящий момент времени определение такой взаимосвязи вызывает затруднение у
большинства исследователей в этой области. Существует несколько определений понятия эмоция прямо или косвенно относящихся к
определению эмоционального окраса звуков речи:
Эмоции - одна из форм отражения. Эмоции отражают отношения к потребностям, целям и мотивам деятельности человека, переживающего эти эмоции.
Процесс, который оценивает внешнюю и внутреннюю ситуацию жизнедеятельности в форме переживаний называется эмоцией.
Процесс отражающий оценочное отношение к существующей ситуации, который напрямую связан с понятием речевой сигнал называется эмоцией (с точки зрения речевого сигнала).
Речевой сигнал содержит признаки, характеризующие эмоциональные и физиологические аспекты функциональных состояний.
Классифицируют эмоции на две категории:
Категория положительных эмоций (веселье, радость, смех и т. д.)
Категория отрицательных эмоций (грусть, печаль, угнетение и т. д.)
Соотнесение распознаваемого речевого сигнала с базой звуков, которые необходимо распознать, проходит в три этапа:
1) выделение признака объекта;
2) объединение признаков в группы;
3) выбор предполагаемого значения из ряда вариантов.
Актуальностью данной работы является использование характеристик для разработки алгоритма определения эмоционального состояния человека. Это является важной частью для многих сфер деятельности человека, и представляет собой востребованную функцию в современных системах имеющих автоматизированное управление, реабилитацию, срочное оповещение.
Целью работы является исследование характеристик, зависящих от эмоционального состояния звуков.
Задачи исследования:
Проанализировать характеристики и признаки речевого сигнала;
Изучить линейные характеристики речи характеризующие эмоциональное состояние;
Исследовать линейные характеристики оценивающие эмоциональную окраску звуков.
большинства исследователей в этой области. Существует несколько определений понятия эмоция прямо или косвенно относящихся к
определению эмоционального окраса звуков речи:
Эмоции - одна из форм отражения. Эмоции отражают отношения к потребностям, целям и мотивам деятельности человека, переживающего эти эмоции.
Процесс, который оценивает внешнюю и внутреннюю ситуацию жизнедеятельности в форме переживаний называется эмоцией.
Процесс отражающий оценочное отношение к существующей ситуации, который напрямую связан с понятием речевой сигнал называется эмоцией (с точки зрения речевого сигнала).
Речевой сигнал содержит признаки, характеризующие эмоциональные и физиологические аспекты функциональных состояний.
Классифицируют эмоции на две категории:
Категория положительных эмоций (веселье, радость, смех и т. д.)
Категория отрицательных эмоций (грусть, печаль, угнетение и т. д.)
Соотнесение распознаваемого речевого сигнала с базой звуков, которые необходимо распознать, проходит в три этапа:
1) выделение признака объекта;
2) объединение признаков в группы;
3) выбор предполагаемого значения из ряда вариантов.
Актуальностью данной работы является использование характеристик для разработки алгоритма определения эмоционального состояния человека. Это является важной частью для многих сфер деятельности человека, и представляет собой востребованную функцию в современных системах имеющих автоматизированное управление, реабилитацию, срочное оповещение.
Целью работы является исследование характеристик, зависящих от эмоционального состояния звуков.
Задачи исследования:
Проанализировать характеристики и признаки речевого сигнала;
Изучить линейные характеристики речи характеризующие эмоциональное состояние;
Исследовать линейные характеристики оценивающие эмоциональную окраску звуков.
В ходе выполнения выпускной квалификационной работы было выявлено, что для определения эмоционального окраса звуков речи важно применение сразу несколько комбинаций характеристик, чем их больше, тем больше вероятность точного определения эмоционального окраса. Данными характеристиками являются: основной тон, количество пауз, громкость речи.
Проведено исследование влияние эмоций на характеристики речевого сигнала. Изучены признаки и характеристики звуковых сигналов
Проведен сравнительный анализ характеристик речевого сигнала. Самой эффективной характеристикой оказалась характеристика оценивающая основной тон. Самой неэффективной громкость звука. Громкость звука может меняться в зависимости от эмоционального состояния будто это крик положительный или отрицательный.
Проведено исследование влияние эмоций на характеристики речевого сигнала. Изучены признаки и характеристики звуковых сигналов
Можно сделать вывод, что от эмоционального состояния голоса диктора зависят параметры записанного звукового файла. При положительном эмоциональном состоянии средние значения частот основного тона min=118,2 Гц и max=146,8 Гц отличаются от средних значений частот основного тона грустного эмоционального состояния и соответственно равны min=114,7 Гц и max=128 Гц на 3,5 Гц и 18,8 Гц для min и max соответственно. Так же значительно отличается параметр отношения изменения количества участков записанного звука. Для положительного эмоционального состояния он равен 0,93, а для отрицательного 0,57. Это связанно с тем, что при отрицательном эмоциональном состоянии не такое частое повышение частот основного тона, как при положительном. Даже если посмотреть на рисунки диапазона изменения спектра и основного тона, то можно увидеть, что значения частот основного тона при отрицательном эмоциональном состоянии несколько ниже, чем при положительном, а так же есть отличия в количестве диапазонов изменения участков частот основного тона. При отрицательном эмоциональном состоянии их чуть-чуть меньше, но это не главное, главное то что значений min и max в два раза меньше по отношению к общему количеству участков, где показывается в параметрах отношения изменения количества участков записанного звука при отрицательном эмоциональном состоянии.
При примерно одинаковой длительности звука среднее количество и длительность пауз положительных эмоций меньше, а длительность и количество непрерывных звукосочетаний наоборот больше.
По уровню громкости нельзя точно определить какой именно эмоциональный окрас имеет звуковой файл, так как при радостном всплеске эмоций по таблице есть определение по категории эмоций-крик, что не является действительностью, а при угнетенном состоянии показывает нормальный, то есть нейтральное состояние. Но по большому счету при радостном всплеске положительного эмоционального окраса и разрывающимся крике отрицательного окраса, возможно совпадение уровня громкости, такое же совпадение возможно при угнетенном состоянии.
Проведен сравнительный анализ характеристик речевого сигнала. Самой эффективной характеристикой оказалась характеристика оценивающая основной тон. Самой неэффективной-громкость звука. Громкость звука может меняться в зависимости от эмоционального состояния будто это крик положительный или отрицательный.
Проведено исследование влияние эмоций на характеристики речевого сигнала. Изучены признаки и характеристики звуковых сигналов
Проведен сравнительный анализ характеристик речевого сигнала. Самой эффективной характеристикой оказалась характеристика оценивающая основной тон. Самой неэффективной громкость звука. Громкость звука может меняться в зависимости от эмоционального состояния будто это крик положительный или отрицательный.
Проведено исследование влияние эмоций на характеристики речевого сигнала. Изучены признаки и характеристики звуковых сигналов
Можно сделать вывод, что от эмоционального состояния голоса диктора зависят параметры записанного звукового файла. При положительном эмоциональном состоянии средние значения частот основного тона min=118,2 Гц и max=146,8 Гц отличаются от средних значений частот основного тона грустного эмоционального состояния и соответственно равны min=114,7 Гц и max=128 Гц на 3,5 Гц и 18,8 Гц для min и max соответственно. Так же значительно отличается параметр отношения изменения количества участков записанного звука. Для положительного эмоционального состояния он равен 0,93, а для отрицательного 0,57. Это связанно с тем, что при отрицательном эмоциональном состоянии не такое частое повышение частот основного тона, как при положительном. Даже если посмотреть на рисунки диапазона изменения спектра и основного тона, то можно увидеть, что значения частот основного тона при отрицательном эмоциональном состоянии несколько ниже, чем при положительном, а так же есть отличия в количестве диапазонов изменения участков частот основного тона. При отрицательном эмоциональном состоянии их чуть-чуть меньше, но это не главное, главное то что значений min и max в два раза меньше по отношению к общему количеству участков, где показывается в параметрах отношения изменения количества участков записанного звука при отрицательном эмоциональном состоянии.
При примерно одинаковой длительности звука среднее количество и длительность пауз положительных эмоций меньше, а длительность и количество непрерывных звукосочетаний наоборот больше.
По уровню громкости нельзя точно определить какой именно эмоциональный окрас имеет звуковой файл, так как при радостном всплеске эмоций по таблице есть определение по категории эмоций-крик, что не является действительностью, а при угнетенном состоянии показывает нормальный, то есть нейтральное состояние. Но по большому счету при радостном всплеске положительного эмоционального окраса и разрывающимся крике отрицательного окраса, возможно совпадение уровня громкости, такое же совпадение возможно при угнетенном состоянии.
Проведен сравнительный анализ характеристик речевого сигнала. Самой эффективной характеристикой оказалась характеристика оценивающая основной тон. Самой неэффективной-громкость звука. Громкость звука может меняться в зависимости от эмоционального состояния будто это крик положительный или отрицательный.



