Введение 2
Глава 1. Обзор существующих методов распознавания акустических данных 4
1.1. Спектральная шумометрия 4
1.2. Проблематика детектирования песка в скважинах 8
1.3. Методы машинного обучения в распознавание акустических данных 10
1.3.1. Метод опорных векторов 10
1.3.2. Нейронные сети 12
Глава 2. Описание базы данных 16
2.1 . Методы представления данных 16
2.2. Описание исходных данных 17
Глава 3. Сверточные нейронные сети 20
Глава 4. Экспериментальная часть 23
4.1. Детектирования песка по данным шумометрии 23
4.2. Детектирование объекта на изображении 24
4.2.1. Использование морфологических операций 25
4.2.2. Использование сверточных нейронных сетей 26
4.3. Описание используемых программ 28
Заключение 29
Список литературы 30
Приложение A 33
Приложение B 33
Приложение С 35
Приложение D 39
Развитие методов записи и хранения данных привело к быстрому росту объемов собираемой и анализируемой информации. Объемы информации настолько огромны, что человеку просто не по силам проанализировать их самостоятельно, поэтому для автоматического анализа данных применяется Data Mining.
Data Mining - это процесс извлечения нетривиальных ранее неизвестных полезных и доступных знаний в "сырых" данных, которые необходимы для принятия верных решений в самых разнообразных областях жизнедеятельности человека.
Сведения, обнаруженная при использовании технологий машинного обучения, должна быть новой. Знания обязаны характеризовать новые закономерности, взаимосвязи различных свойств, предсказывать значения одних признаков на основе других и т.д. Необходимо, чтобы обнаруженные знания распространялись и на новые данные с некоторой степенью достоверности.
Алгоритмы, применяемые в Data Mining, используют большое количество вычислительной мощности. Раньше это было главным сдерживающим фактором для широкого применения Data Mining в практических целях, однако нынешний рост производительности современных процессоров снимает все ограничения. Теперь за довольно относительное короткое время можно качественно проанализировать сотню тысяч и миллионов записей.
Сфера применения алгоритмов машинного обучения очень обширна. В настоящее время Data Mining нашла применение в таких областях, как розничная торговля, банковское дело, телекоммуникации, страхование, молекулярная генетика и генная инженерия, прикладная химия, медицина и здравоохранение, авионика, интернет, связь, автоматизация производства, робототехника, геологоразведка и т.п.
В рамках данной дипломной работы проводиться исследования в области распознавания данных, имеющих акустический характер. Главной проблемой в классификации источников акустического сигнала является многочисленные вариации. Звук определенного источника, различается при каждом событии, так как физический процесс во многих случаях меняется со временем. Так же это связано с влиянием местоположение источника относительно приемника и то в какой среде распространяется волна. В случае схожести сигналов распознавание проводилось бы сравнением текущего сигнала с шаблонами, находящихся в памяти.
За последние годы наблюдается повышенный уровень внимания к методам распознавания источников звуковых событий, увеличилось качество распознавания, тем не менее решение подобных задач, независимо от того в какой среде распространяется звук, еще не достигла сто процентных результатов. Поэтому актуальность исследований нынешних алгоритмов не спадает, и поиск новых способов решения задач в этой области продолжается.
Цель данной работы заключается в разработке программного комплекса автоматического детектирования и классификации источников акустических сигналов на основе сверточных нейронных сетей.
В ходе исследования решаются следующие задачи:
> обзор существующих методов распознавания источников акустических данных;
> подготовка базы данных для обучения и тестирования;
> выбор архитектуры и алгоритма обучения нейронной сети;
> проведения тестирования выбранного метода на подготовленной базе данных.
В ходе исследовательской работы были изучены основные возможности сверточных нейронных сетей, а именно:
1. Применение сверточных нейронных сетей в распознавании акустических сигналов. В качестве тестирования была решена задача о детектировании песка в скважине, основываясь на данные спектральной шумометрии. Решение задачи была разбита на несколько этапов: разработка программы для подготовки базы данных (изображений характеризующих временной ряд), обучение сверточной нейронной сети, тестирование на реальных данных.
Как итог была спроектирована система распознавания звуков от ударов песчинок с использованием сверточных нейронных сетей, подобрана оптимальная архитектура и признаки для распознавнаия. Применение сверточных сетей показывает перспективные результаты для работы с ними, а использование визуализации временного ряда в виде Grammian Angular Field вместо спектрограмм, упрощает входные данные.
Для полного использования возможностей данного подхода предстоит увеличить количество обучаемых параметров до десятков миллионов (что пока не позволяет вычислительная мощность имеющегося компьютера), увеличить базу данных до десятков тысяч, для ускорения процесса обучения стоит использовать технологии CUDA для проведения вычисления на GPU вместо CPU.
2. Разработан алгоритм подсчета песчинок для контроля качества проведения экспериментов в лаборатории. Использовалось два подхода: применение морфологических операций и применение сверточная нейронная сети. Сверточные нейронные сети показали лучший результат найдя все песчинки.