Введение 2
Глава 1. Обзор существующих методов распознавания акустических данных 4
1.1. Спектральная шумометрия 4
1.2. Проблематика детектирования песка в скважинах 8
1.3. Методы машинного обучения в распознавание акустических данных 10
1.3.1. Метод опорных векторов 10
1.3.2. Нейронные сети 12
Глава 2. Описание базы данных 16
2.1 . Методы представления данных 16
2.2. Описание исходных данных 17
Глава 3. Сверточные нейронные сети 20
Глава 4. Экспериментальная часть 23
4.1. Детектирования песка по данным шумометрии 23
4.2. Детектирование объекта на изображении 24
4.2.1. Использование морфологических операций 25
4.2.2. Использование сверточных нейронных сетей 26
4.3. Описание используемых программ 28
Заключение 29
Список литературы 30
Приложение A 33
Приложение B 33
Приложение С 35
Приложение D 39
Развитие методов записи и хранения данных привело к быстрому росту объемов собираемой и анализируемой информации. Объемы информации настолько огромны, что человеку просто не по силам проанализировать их самостоятельно, поэтому для автоматического анализа данных применяется Data Mining.
Data Mining - это процесс извлечения нетривиальных ранее неизвестных полезных и доступных знаний в "сырых" данных, которые необходимы для принятия верных решений в самых разнообразных областях жизнедеятельности человека.
Сведения, обнаруженная при использовании технологий машинного обучения, должна быть новой. Знания обязаны характеризовать новые закономерности, взаимосвязи различных свойств, предсказывать значения одних признаков на основе других и т.д. Необходимо, чтобы обнаруженные знания распространялись и на новые данные с некоторой степенью достоверности.
Алгоритмы, применяемые в Data Mining, используют большое количество вычислительной мощности. Раньше это было главным сдерживающим фактором для широкого применения Data Mining в практических целях, однако нынешний рост производительности современных процессоров снимает все ограничения. Теперь за довольно относительное короткое время можно качественно проанализировать сотню тысяч и миллионов записей.
Сфера применения алгоритмов машинного обучения очень обширна. В настоящее время Data Mining нашла применение в таких областях, как розничная торговля, банковское дело, телекоммуникации, страхование, молекулярная генетика и генная инженерия, прикладная химия, медицина и здравоохранение, авионика, интернет, связь, автоматизация производства, робототехника, геологоразведка и т.п.
В рамках данной дипломной работы проводиться исследования в области распознавания данных, имеющих акустический характер. Главной проблемой в классификации источников акустического сигнала является многочисленные вариации. Звук определенного источника, различается при каждом событии, так как физический процесс во многих случаях меняется со временем. Так же это связано с влиянием местоположение источника относительно приемника и то в какой среде распространяется волна. В случае схожести сигналов распознавание проводилось бы сравнением текущего сигнала с шаблонами, находящихся в памяти.
За последние годы наблюдается повышенный уровень внимания к методам распознавания источников звуковых событий, увеличилось качество распознавания, тем не менее решение подобных задач, независимо от того в какой среде распространяется звук, еще не достигла сто процентных результатов. Поэтому актуальность исследований нынешних алгоритмов не спадает, и поиск новых способов решения задач в этой области продолжается.
Цель данной работы заключается в разработке программного комплекса автоматического детектирования и классификации источников акустических сигналов на основе сверточных нейронных сетей.
В ходе исследования решаются следующие задачи:
> обзор существующих методов распознавания источников акустических данных;
> подготовка базы данных для обучения и тестирования;
> выбор архитектуры и алгоритма обучения нейронной сети;
> проведения тестирования выбранного метода на подготовленной базе данных.
В ходе исследовательской работы были изучены основные возможности сверточных нейронных сетей, а именно:
1. Применение сверточных нейронных сетей в распознавании акустических сигналов. В качестве тестирования была решена задача о детектировании песка в скважине, основываясь на данные спектральной шумометрии. Решение задачи была разбита на несколько этапов: разработка программы для подготовки базы данных (изображений характеризующих временной ряд), обучение сверточной нейронной сети, тестирование на реальных данных.
Как итог была спроектирована система распознавания звуков от ударов песчинок с использованием сверточных нейронных сетей, подобрана оптимальная архитектура и признаки для распознавнаия. Применение сверточных сетей показывает перспективные результаты для работы с ними, а использование визуализации временного ряда в виде Grammian Angular Field вместо спектрограмм, упрощает входные данные.
Для полного использования возможностей данного подхода предстоит увеличить количество обучаемых параметров до десятков миллионов (что пока не позволяет вычислительная мощность имеющегося компьютера), увеличить базу данных до десятков тысяч, для ускорения процесса обучения стоит использовать технологии CUDA для проведения вычисления на GPU вместо CPU.
2. Разработан алгоритм подсчета песчинок для контроля качества проведения экспериментов в лаборатории. Использовалось два подхода: применение морфологических операций и применение сверточная нейронная сети. Сверточные нейронные сети показали лучший результат найдя все песчинки.
1. Хайкин Саймон. Нейронные сети: полный курс, 2-е издание. : Пер. с англ. - М. : Издательский дом «Вильямс», 2006. - 1104 с.
2. Classification of EEG Signals by using Support Vector Machines. K.Sercan Bayram, M. Ayyuce Kizrak. Electrical & Electronics Eng. Dpt. Halic University, Istanbul, Turkey, 02 June 2013
3. Emotion Recognition based on EEG using LSTM Recurrent Neural Network. Salma Alhagry, Aly Aly Fahmy, Reda A. El-Khoribi. International Journal of Advanced Computer Science and Applications, Vol. 8, No. 10, 2017.
4. Imaging Time-Series to Improve Classification and Imputation. Zhiguang Wang and Tim Oates. Department of Computer Science and Electric Engineering University of Maryland, Baltimore County. 1 Jun 2015
5. Classification of Time-Series Images Using Deep Convolutional Neural Networks. Nima Hatami, Yann Gavet and Johan Debayle. Ecole Nationale Superieure des Mines de Saint-Etienne, France, 7oct2017
6. Snore Sound Classification Using Image-based Deep Spectrum Features. Shahin Amiriparian, Maurice Gerczuk, Sandra Ottl, Nicholas Cummins, Michael Freitag, Sergey Pugachevskiy, Alice Baird. INTERSPEECH August 20-24, 2017, Stockholm, Sweden.
7. AcctionNet: A Dataset Of Human Activity Recognition Using On-phone Motion Sensors. James Bartlett, Vinay Prabhu, John Whaley, 2017.
8. Study and Comparison of Vibration-Based Intrusive and Non-Intrusive Sand Monitoring System. Gang Liu, Pengtao Liu and Baosheng He, Department of Petroleum Engineering, China University of Petroleum, Qingdao, China, Research Centre of China National Offshore Oil Corporation, Beijing, China. Trans Tech Publications, Switzerland
27.05.2013
9. Intrusive Vibration Sand Monitoring System for Heavy Oil and the Laboratory Evaluation, Gang Liu, Pengtao Liu and Baosheng He. Department of Petroleum Engineering, China University of Petroleum, Qingdao, China, Research Centre of China National Offshore Oil Corporation, Beijing, China. Trans Tech Publications, Switzerland
15.07.2013
10. Implementation of Training Convolutional Neural Networks.Tianyi Liu, Shuangsang Fang, Yuehui Zhao, Peng Wang, Jun Zhang, University of Chinese Academy of Sciences, Beijing, China
11. Course materials and notes for Stanford class: CS231n Convolution Neural Network for Visual Recognition. http://cs231n.github.io/
12. On line EM wave sand monitoring sensor for oil industry [Текст] / A.I. Shamma'a, et al. //33rd European Microwave Conference. - 2003. - Vol.2. -P.535-538.
13. Integration of intrusive and non-intrusive methods for corrosion and sand/erosion monitoring. K. Wold, R. Stoen, M. Rapone. La Metallurgia Italiana. 2012.
14. SNL Spectral Noise Logging TGT Oilfield Services. Arthur Aslanyan and Dmitry Davydov. September 2012.
15. Spectral Noise Logging SNL-HD White paper. TGT Oilfield Services.