РАСПОЗНАВАНИЕ ИСТОЧНИКОВ АКУСТИЧЕСКИХ СИГНАЛОВ С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ
|
ВВЕДЕНИЕ 5
ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ СИСТЕМ АВТОМАТИЧЕСКОГО
РАСПОЗНАВАНИЯ АКУСТИЧЕСКИХ СИГНАЛОВ 7
1.1 Области применения систем автоматического распознавания
акустических сигналов 7
1.1.1 Биометрические системы 7
1.1.2 Системы распознавания звуков окружающей среды 8
1.1.3 Системы распознавания музыки и музыкальных инструментов 8
1.1.4 Научно-прикладные задачи 8
1.2 Требования, предъявляемые к системам распознавания источников
звука 15
1.3 Анализ структуры существующих систем автоматического
распознавания источников акустических сигналов 16
1.1.1. Методы обнаружения звуковых событий в непрерывном
аудиопотоке 19
1.1.2. Признаки, используемые для распознавания 24
1.1.3. Распознавание звуковых событий с использованием методов
машинного обучения 26
1.4 Выводы к главе 1 30
ГЛАВА 2. РАЗВИТИЕ ПРОГРАММНОГО КОМПЛЕКСА ДЛЯ
АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ЗВУКОВЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ 32
2.1 Искусственные нейронные сети, используемые для распознавания источников звука 32
2.1.1 Многослойные сети прямого распространения 33
2.1.2 Самоорганизующиеся карты Кохонена 37
2.2 Выбор значимых признаков 40
2.3 Блок-схема нейросетевого алгоритма распознавания источников
акустических сигналов с учителем 42
2.4 Анализ эффективности нейросетевого алгоритма распознавания в
задачах идентификации дикторов 44
2.4.1 База данных 44
2.4.2 Обнаружение звукового события 45
2.4.3 Извлечение признаков и обучение нейронной сети 48
2.4.4 Тестирование 49
2.5 Выводы к главе 2 50
ГЛАВА 3. ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ТИПА ФЛЮИДА ПО ДАННЫМ СКВАЖИННОЙ СПЕКТРАЛЬНОЙ ШУМОМЕТРИИ 52
3.1 База данных с записями акустических шумов в скважинах и в
лабораторных условиях 53
3.2 Выделение значимых участков шумов по данным шумометрии 55
3.3 Индексирование скважинных данных 56
3.4 Обучение нейронной сети 58
3.5 Тестирование программного комплекса распознавания 60
3.6 Выводы к главе 3 64
ГЛАВА 4. ПРИМЕНЕНИЕ ПРОГРАММНОГО КОМПЛЕКСА В ЗАДАЧЕ
ДЕТЕКТИРОВАНИЯ ПЕСКА ПО ДАННЫМ ШУМОМЕТРИИ 66
4.1 Обзор существующих методов детектирования песка в скважинах 66
4.2 Детектирование песка на данных спектральной шумометрии 68
4.2.1 База данных с записями акустических шумов в скважинах и в
лабораторных условиях 69
4.2.2 Обнаружение звукового события 71
4.2.3 Извлечение значимых признаков и обучение нейронной сети 73
4.2.4 Тестирование обученной нейронной сети 74
4.3 Выводы к главе 4 76
ЗАКЛЮЧЕНИЕ 78
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 80
ПРИЛОЖЕНИЕ А 87
ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ СИСТЕМ АВТОМАТИЧЕСКОГО
РАСПОЗНАВАНИЯ АКУСТИЧЕСКИХ СИГНАЛОВ 7
1.1 Области применения систем автоматического распознавания
акустических сигналов 7
1.1.1 Биометрические системы 7
1.1.2 Системы распознавания звуков окружающей среды 8
1.1.3 Системы распознавания музыки и музыкальных инструментов 8
1.1.4 Научно-прикладные задачи 8
1.2 Требования, предъявляемые к системам распознавания источников
звука 15
1.3 Анализ структуры существующих систем автоматического
распознавания источников акустических сигналов 16
1.1.1. Методы обнаружения звуковых событий в непрерывном
аудиопотоке 19
1.1.2. Признаки, используемые для распознавания 24
1.1.3. Распознавание звуковых событий с использованием методов
машинного обучения 26
1.4 Выводы к главе 1 30
ГЛАВА 2. РАЗВИТИЕ ПРОГРАММНОГО КОМПЛЕКСА ДЛЯ
АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ЗВУКОВЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ 32
2.1 Искусственные нейронные сети, используемые для распознавания источников звука 32
2.1.1 Многослойные сети прямого распространения 33
2.1.2 Самоорганизующиеся карты Кохонена 37
2.2 Выбор значимых признаков 40
2.3 Блок-схема нейросетевого алгоритма распознавания источников
акустических сигналов с учителем 42
2.4 Анализ эффективности нейросетевого алгоритма распознавания в
задачах идентификации дикторов 44
2.4.1 База данных 44
2.4.2 Обнаружение звукового события 45
2.4.3 Извлечение признаков и обучение нейронной сети 48
2.4.4 Тестирование 49
2.5 Выводы к главе 2 50
ГЛАВА 3. ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ТИПА ФЛЮИДА ПО ДАННЫМ СКВАЖИННОЙ СПЕКТРАЛЬНОЙ ШУМОМЕТРИИ 52
3.1 База данных с записями акустических шумов в скважинах и в
лабораторных условиях 53
3.2 Выделение значимых участков шумов по данным шумометрии 55
3.3 Индексирование скважинных данных 56
3.4 Обучение нейронной сети 58
3.5 Тестирование программного комплекса распознавания 60
3.6 Выводы к главе 3 64
ГЛАВА 4. ПРИМЕНЕНИЕ ПРОГРАММНОГО КОМПЛЕКСА В ЗАДАЧЕ
ДЕТЕКТИРОВАНИЯ ПЕСКА ПО ДАННЫМ ШУМОМЕТРИИ 66
4.1 Обзор существующих методов детектирования песка в скважинах 66
4.2 Детектирование песка на данных спектральной шумометрии 68
4.2.1 База данных с записями акустических шумов в скважинах и в
лабораторных условиях 69
4.2.2 Обнаружение звукового события 71
4.2.3 Извлечение значимых признаков и обучение нейронной сети 73
4.2.4 Тестирование обученной нейронной сети 74
4.3 Выводы к главе 4 76
ЗАКЛЮЧЕНИЕ 78
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 80
ПРИЛОЖЕНИЕ А 87
Многие события и объекты могут быть распознаны только на основе генерируемых ими звуковых сигналов. Распознавание означает то, что слышится сейчас, каким-то образом соответствует тому, что уже слышали в прошлом [1], например, голос по телефону, или шаги идущего по коридору человека.
Основной проблемой в распознавании источников звука являются контекстные вариации. Звуковые волны, создаваемые определенным источником, различаются при каждом событии. Если бы они были похожи, то распознавание бы происходило путем сравнения волн с шаблонами, хранящимися в памяти. В реальном мире волны, производимые в разное время, очень разные. Это связано с тем, что физический процесс, генерирующий звук, очень редко остается одинаковым в разные моменты времени. Кроме того, положение источника по отношению к слушателю и акустические характеристики окружающей среды влияют на звуковые волны.
Исследования в области распознавания источников акустических сигналов начались несколько десятилетий назад и продолжаются в настоящее время. За последние годы наблюдается значительное повышение качества распознавания, однако основная проблема автоматического распознавания источника, независимо от акустического окружения, все еще далека от решения. Именно поэтому актуальны как исследования уже существующих алгоритмов, так и поиск новых решений в данной области.
Целью данной работы является разработка программного комплекса автоматического распознавания источников акустических сигналов с использованием искусственных нейронных сетей.
Для достижения данной цели необходимо решить следующие задачи:
• обзор существующих систем автоматического распознавания источников акустических сигналов;
• сбор и анализ базы данных;
• выбор значимых признаков и проверка их эффективности в задачах идентификации дикторов;
• выбор архитектуры и алгоритма обучения искусственной нейронной сети;
• тестирование разработанного программного комплекса
автоматического распознавания типа флюида по скважинным акустическим данным;
• применение программного комплекса в задаче детектирования песка по данным шумометрии.
Данная работа состоит из введения, четырех глав основной части, заключения, приложения и списка использованной литературы.
В первой обзорной главе представлен обзор существующих систем автоматического распознавания источников акустических сигналов, их структура и области применения. Говорится о требованиях, предъявляемых к данным системам.
Во второй главе представлены краткие сведения из теории искусственных нейронных сетей. Представлена и описана блок-схема нейросетевого алгоритма распознавания источников звука. Проведен анализ эффективности нейросетевого алгоритма распознавания и значимых признаков в задачах идентификации дикторов.
В главе 3 представлен разработанный программный комплекс автоматического распознавания типа флюида по данным скважинной спектральной шумометрии.
В главе 4 приведен обзор существующих методов акустического детектирования песка в скважинах. Предложен метод детектирования песка по данным спектральной шумометрии.
Заключение содержит основные результаты проделанной работы.
Основной проблемой в распознавании источников звука являются контекстные вариации. Звуковые волны, создаваемые определенным источником, различаются при каждом событии. Если бы они были похожи, то распознавание бы происходило путем сравнения волн с шаблонами, хранящимися в памяти. В реальном мире волны, производимые в разное время, очень разные. Это связано с тем, что физический процесс, генерирующий звук, очень редко остается одинаковым в разные моменты времени. Кроме того, положение источника по отношению к слушателю и акустические характеристики окружающей среды влияют на звуковые волны.
Исследования в области распознавания источников акустических сигналов начались несколько десятилетий назад и продолжаются в настоящее время. За последние годы наблюдается значительное повышение качества распознавания, однако основная проблема автоматического распознавания источника, независимо от акустического окружения, все еще далека от решения. Именно поэтому актуальны как исследования уже существующих алгоритмов, так и поиск новых решений в данной области.
Целью данной работы является разработка программного комплекса автоматического распознавания источников акустических сигналов с использованием искусственных нейронных сетей.
Для достижения данной цели необходимо решить следующие задачи:
• обзор существующих систем автоматического распознавания источников акустических сигналов;
• сбор и анализ базы данных;
• выбор значимых признаков и проверка их эффективности в задачах идентификации дикторов;
• выбор архитектуры и алгоритма обучения искусственной нейронной сети;
• тестирование разработанного программного комплекса
автоматического распознавания типа флюида по скважинным акустическим данным;
• применение программного комплекса в задаче детектирования песка по данным шумометрии.
Данная работа состоит из введения, четырех глав основной части, заключения, приложения и списка использованной литературы.
В первой обзорной главе представлен обзор существующих систем автоматического распознавания источников акустических сигналов, их структура и области применения. Говорится о требованиях, предъявляемых к данным системам.
Во второй главе представлены краткие сведения из теории искусственных нейронных сетей. Представлена и описана блок-схема нейросетевого алгоритма распознавания источников звука. Проведен анализ эффективности нейросетевого алгоритма распознавания и значимых признаков в задачах идентификации дикторов.
В главе 3 представлен разработанный программный комплекс автоматического распознавания типа флюида по данным скважинной спектральной шумометрии.
В главе 4 приведен обзор существующих методов акустического детектирования песка в скважинах. Предложен метод детектирования песка по данным спектральной шумометрии.
Заключение содержит основные результаты проделанной работы.
1. Предложена блок-схема обучения нейросетевого алгоритма распознавания источников акустических сигналов, состоящая из следующих этапов: предварительная обработка, индексирование входных данных, извлечение значимых признаков и обучение. В качестве значимых признаков в данной работе были использованы коэффициенты отражения авторегрессионной модели. Обучение проводилось с использованием искусственных нейронных сетей.
2. Для анализа эффективности предложенного алгоритма и выбора значимых признаков создана система автоматической идентификации диктора. Для данной системы создана база данных, состоящая из дикторов, произносящих буквы английского алфавита. Для автоматического выделения букв из непрерывных записей дикторов разработан метод на основе характеристик речевых сигналов - кратковременная энергия и число нулей интенсивности. Данный метод успешно справился со своей задачей и выделил звуковые сигналы букв для каждого диктора. В качестве распознавателя была выбрана и обучена самоорганизующаяся карта Кохонена. Точность идентификации дикторов составила более 95%. В результате на примере распознавания дикторов было показано, что коэффициенты отражения являются значимыми признаками в задаче распознавания источников акустических сигналов.
3. Разработан программный комплекс автоматического распознавания типа флюида по данным скважинной спектральной шумометрии. Была создана база данных, состоящая из 60 скважин с различными типами флюидов и лабораторных экспериментов. Для автоматического выделения значимых шумов был разработан метод на основе медианной фильтрации и операций математической морфологии. Были выбраны оптимальный порядок авторегрессионной модели и архитектура искусственной нейронной сети.
В качестве распознавателя выбрана трехслойная нейронная сеть прямого распространения. В качестве обучающего алгоритма использован алгоритм Левенберга-Марквардта. Для каждого типа флюида обучена своя искусственная нейронная сеть. В результате эффективность распознавания типа флюида по данным скважинной шумометрии достигнута более 90%.
4. Разработанный программный комплекс был применен в задаче детектирования песка по данным спектральной шумометрии. Собрана база данных, состоящая из лабораторных экспериментов и скважин с песком и без. Обучена карта Кохонена для детектирования наличия всплесков на акустических данных. В качестве распознавателя удара песка на данных была выбрана трехслойная нейронная сеть прямого распространения. В ходе тестирования разработанная система показала уверенную регистрацию зон выноса песка по данным спектральной шумометрии.
2. Для анализа эффективности предложенного алгоритма и выбора значимых признаков создана система автоматической идентификации диктора. Для данной системы создана база данных, состоящая из дикторов, произносящих буквы английского алфавита. Для автоматического выделения букв из непрерывных записей дикторов разработан метод на основе характеристик речевых сигналов - кратковременная энергия и число нулей интенсивности. Данный метод успешно справился со своей задачей и выделил звуковые сигналы букв для каждого диктора. В качестве распознавателя была выбрана и обучена самоорганизующаяся карта Кохонена. Точность идентификации дикторов составила более 95%. В результате на примере распознавания дикторов было показано, что коэффициенты отражения являются значимыми признаками в задаче распознавания источников акустических сигналов.
3. Разработан программный комплекс автоматического распознавания типа флюида по данным скважинной спектральной шумометрии. Была создана база данных, состоящая из 60 скважин с различными типами флюидов и лабораторных экспериментов. Для автоматического выделения значимых шумов был разработан метод на основе медианной фильтрации и операций математической морфологии. Были выбраны оптимальный порядок авторегрессионной модели и архитектура искусственной нейронной сети.
В качестве распознавателя выбрана трехслойная нейронная сеть прямого распространения. В качестве обучающего алгоритма использован алгоритм Левенберга-Марквардта. Для каждого типа флюида обучена своя искусственная нейронная сеть. В результате эффективность распознавания типа флюида по данным скважинной шумометрии достигнута более 90%.
4. Разработанный программный комплекс был применен в задаче детектирования песка по данным спектральной шумометрии. Собрана база данных, состоящая из лабораторных экспериментов и скважин с песком и без. Обучена карта Кохонена для детектирования наличия всплесков на акустических данных. В качестве распознавателя удара песка на данных была выбрана трехслойная нейронная сеть прямого распространения. В ходе тестирования разработанная система показала уверенную регистрацию зон выноса песка по данным спектральной шумометрии.



