Реферат 2
Список сокращений и терминов 5
Введение 6
1. Обзор применяемых методов для обнаружения аномалий
в технологических сигналах 8
1.1 Обзор существующих работ по поиску аномалий во временных рядах 8
1.2 Обзор методов детектирования аномалий на основе СММ 10
1.3 Выводы по первой главе 12
2. Генерация данных, алгоритмы обучения и обнаружения аномалий на основе СММ .... 13
2.1. Формальное определение скрытой Марковской модели и ее основные элементы и
методы 13
2.1.1 Алгоритм генерации последовательности наблюдений СММ 13
2.1.2 Описание алгоритма прямого-обратного хода 14
2.1.3 Описание алгоритма Баума-Вельша 15
2.1.4 Применение СММ на практике 16
2.2. Описание СММ для технологических сигналов 17
2.3. Алгоритм обучения СММ с гауссовой смесью 18
2.4. Описание алгоритма детектирования аномалий в технологических сигналах обу-ченной СММ 20
2.5 Генерация технологических сигналов с помощью СММ 21
2.6 Оценка качества поиска аномалий в технологических сигналах 25
2.7 Выводы по второй главе 26
3. Результаты экспериментальных исследований 27
3.1 Программные инструменты 27
3.2 Эксперименты на сгенерированных сигналах 27
3.2.1 Обучение СММ 28
3.2.2 Тестирование модели и алгоритма обнаружения аномалий 28
3.3 Эксперименты на многомерных временных рядах 37
3.3.1 Обучение СММ на данных GHL 39
3.3.2 Тестирование СММ для GHL 40
3.4 Выводы по результатам проведённых экспериментов 43
Заключение 44
Список использованных источников 45
Современные технологии в XXI веке помогают не только усовершенствовать технологии на производстве, но и значительно облегчить её деятельность. Так, для получения наиболее высоких результатов своей деятельности предприятия применяют автоматизацию технологических процессов. Автоматизация технологического процесса создаётся при помощи АСУТП. Как правило, АСУТП имеет единую систему операторского управления технологическим процессом в виде одного или нескольких пультов управления, средства обработки и архивирования информации о ходе процесса, типовые элементы автоматики: датчики, контроллеры, исполнительные устройства [ 1].
При обслуживании и эксплуатации систем АСУТП одной из важных задач является обнаружение неполадок в механизмах по показаниям датчиков.
Задача обнаружения аномалий в технологических сигналах решается путем анализа временных рядов датчиков (например, температуры или давления). С помощью анализа можно классифицировать временной ряд на периоды нормальной работы агрегата и различные состояния неполадок.
Большинство подходов в детектировании аномалий базируются на предположении, что объекты обучающей и тестовой выборок независимы. Временные ряды отличаются тем, что в них данное условие может нарушаться. В частности, при обнаружении аномалий во временных рядах зачастую нельзя игнорировать их временной аспект, что не предусмотрено в большинстве подходов по поиску аномалий.
В данной работе рассматривается проблема недостаточной изученности подходов и методов к обнаружению аномалий во временных рядах. Объектом исследования является процесс обнаружения аномальных показаний датчиков технологического оборудования. Предметом исследования являются подходы обнаружения аномалий на основе скрытых Марковских моделей (СММ).
Таким образом целью данного исследования является разработка алгоритма обнаружения аномалий в технологических сигналах с использованием СММ.
Для достижения цели исследования необходимо решить следующие задачи:
1. изучение научных статей и литературы, посвящённых обнаружению аномалий в технологических сигналах; изучить подходы применения скрытых Марковских моделей в схожих задачах;
2. собрать (сгенерировать) и провести первичный анализ данных;
3. спроектировать модель для обнаружения аномалий в технологических сигналах;
4. провести эксперименты с различными видами аномалий на различных данных, сравнить качество результатов; оценить полученные результаты.
При выполнении работы использовались следующие методы исследования:
1. Анализ источников, описывающих существующие подходы к решению
задачи обнаружению аномалий в последовательных данных на основе СММ.
2. Проведение экспериментов по генерации данных, построению и обучению модели, и детектированию аномалий.
3. Расчёт, визуализация и интерпретация полученных результатов
Работа обладает следующей научной новизной:
• Предложены подходы к генерации данных, и наложению аномалий на технологические сигналы, позволяющие решить проблему недостатка подходящих данных.
• Предложена СММ для выполнения классификации участков сигналов на аномальные и не аномальные.
• Предложена методика оценки качества обнаружения аномалий.
Практическая значимость исследования: предложенный подход использования СММ для детектирования аномалий в технологических сигналах позволяет определять аномалии, связанные с временным аспектом (когда само по себе значение показаний датчика не является аномальным, но существует аномально долгое время).
Магистерская диссертация состоит из трёх разделов: в первом разделе рассматривается обзор задачи обнаружения аномалий в технологических сигналах; во втором даётся описание предлагаемой модели обнаружения аномалий в технологических сигналах; в третьем разделе описываются экспериментальные исследования, проведённые с целью оценки эффективности предлагаемого подхода обнаружения аномалий с применением СММ.
В работе рассмотрены вопросы применения скрытых марковских моделей для обнаружения аномалий как в одномерных, так и в многомерных технологических сигналах. Предложен подход к применению СММ для обнаружения аномалий. Рассмотрен алгоритм генерации временных рядов с непрерывным наблюдением на основе СММ с заданными параметрами. Продемонстрирована работоспособность алгоритма обучения СММ с гауссовскими смесями распределений на основе модифицированного алгоритма Баума-Вельша с градиентным спуском. Произведено тестирование обученной СММ и алгоритма обнаружения аномалий на двух наборах данных (одномерных и многомерных временных рядах). Исследованы зависимости гиперпараметров алгоритма детектирования для разных видов аномалий. Предложен алгоритм оценки точности распознавания аномалий. Произведено сравнение качества распознавания аномалий с двумя другими походами. Даны рекомендации по использованию данного подхода в реальных системах.
Полученные результаты исследования подтверждают работоспособность и адекватность предложенного подхода обнаружения аномалий в технологических сигналах. Основным преимуществом настоящего метода детектирования является его способность обнаруживать аномалии, связанные с временным аспектом (когда само по себе значение показаний датчика не является аномальным, но существует аномально долгое время).
1. Хлебенских, Л. В. Автоматизация производства в современном мире / Л. В. Хлебен- ских, М. А. Зубкова, Т. Ю. Саукова. // Молодой ученый. - 2017. - № 16 (150). - С. 308311
2. Arindam Banerjee Varun Chandola and Vipin Kumar, Anomaly detection : A survey, ACM Computing Surveys, 2009.
3. S. Menon, O. Uluyol, K. Kim, and E. O. Nwadiogbu. Incipient fault detection and diagnosis in turbine engines using hidden Markov models. In ASME Turbo Expo., 2003.
4. D. A. Clifton, L. A. Clifton, P. R. Bannister, and L. Tarassenko. Automated novelty detection in industrial systems. Advances of Computational Intelligence in Industrial Systems Studies in Computational Intelligence, 116:269-296, 2008.
5. S. Sarkar, K. Mukherjee, S. Sarkar, and A. Ray. Symbolic transient time-series analysis for fault detection in aircraft gas turbine engines. In American Control Conference, 2012.
6. I. Antoniadou, N. Dervilis, E. Papatheou, A. E. Maguire, and K. Worden. Aspects of structural health and condition monitoring of offshore wind turbines. Philosophical Transactions of the Royal Society A, 373, 2015.
7. O. Geramifard. Hidden Markov modelbased methods in condition monitoring of machinery systems. PhD Thesis, National University of Singapore, 2013.
8. T. Marwala. Condition monitoring using computational intelligence methods: applications in mechanical and electrical systems. Springer, 2012.
9. P. Smyth. Markov monitoring with unknown states. IEEE Journal On Selected Areas In Communications, 12:1600-1612, 1993.
10. M. Dong. A novel approach to equipment health management based on auto-regressive hidden semiMarkov model (AR-HSMM). Science in China Series F: Information Sciences, 51:12911304, 2008.
11. O. Parson, S. Ghosh, M. Weal, and A. Rogers. An unsupervised training method for nonintrusive appliance load monitoring. Artificial Intelligence, 217:1-19, 2014.
12. E. Eskin. Anomaly detection over noisy data using learned probability distributions. In International Conference on Machine Learning, 2000.
13. Hochreiter S.: Long Short-term Memory. Neural Computation, 9 (8), pp. 1735-1780 (1997). doi: 10.1162/neco.1997.9.8.1735
14. Breunig, M.M., Kriegel, H.-P., Ng, R.T., Sander, J.: LOF: Identifying Density-based Local Outliers. Proc. of the 2000 ACM SIGMOD Int. Conference on Management of Data, pp. 93104 (2000)
15. Scholkopf B., et al.: Estimating the Support of a High-dimensional Distribution. Neural Computation, 13 (7), pp. 1443-1471 (2001) [21] Sheriff, M.Z., Nounou, M.N.: Improved Faul..38