Тип работы:
Предмет:
Язык работы:


АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ОБНАРУЖЕНИЯ АНОМАЛИЙ В МНОГОМЕРНЫХ ТЕХНОЛОГИЧЕСКИХ СИГНАЛАХ МЕТОДОМ ГРАДИЕНТНОГО БУСТИНГА

Работа №192936

Тип работы

Магистерская диссертация

Предмет

математика и информатика

Объем работы55
Год сдачи2019
Стоимость5550 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
4
Не подходит работа?

Узнай цену на написание


РЕФЕРАТ 3
СПИСОК СОКРАЩЕНИЙ И ТЕРМИНОВ 7
ВВЕДЕНИЕ 8
1 ОБЗОР ЗАДАЧИ ОБНАРУЖЕНИЯ АНОМАЛИЙ В ТЕХНОЛОГИЧЕСКИХ СИГНАЛАХ 11
1.1 Аномалии во временных рядах 11
1.2 Подходы к решению задачи обнаружения аномалий 14
1.3 Получение данных технологических сигналов 16
2 Алгоритмическое и программное обеспечение обнаружения аномалий в
технологических сигналах 19
2.1 Аугментация данных 19
2.1.1 Наложение аномалий на сигналы 19
2.1.2 Склейка сигналов 21
2.2 Формирование признакового пространства 22
2.3 Классификация градиентным бустингом 24
2.3.1 Описание алгоритма 24
2.3.2 Функции потерь 27
2.3.3 Метрики классификации 28
2.4 Борьба с переобучением 29
2.5 Модель обнаружения аномалий в многомерных технологических
сигналах 30
3 ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ 33
3.1 Программные инструменты 33
3.2 Постановка задачи обнаружения аномалий 33
3.3 Входные экспериментальные данные 33
3.3.1 Реальные сигналы с наложенными аномалиями 34
3.3.2 Набор данных Additional Tennessee Eastman Process Simulation Data
for Anomaly Detection Evaluation Version 1.0 35
3.3.3 Реальные данные нефтепровода 37
3.4 Обучение классификатора 37
3.5 Результаты и их обсуждения 39
ЗАКЛЮЧЕНИЕ 48
СПИСОК ЛИТЕРАТУРЫ 49


В целях повышения конкурентоспособности и эффективности производства, современные предприятия индустриального сектора стоят на пути цифровой трансформации и перехода к концепции Индустрии 4.0. Одним из ключевых моментов такой трансформации является применение принципиально новых подходов к обработке и анализу данных, объем которых растёт с каждым днем. Однако, их практическое использование, как правило, ограничивается задачами визуализации и долговременного хранения, а извлечение знаний из таких данных производится крайне редко [1]. Внедрение современных методов обработки данных с использованием методов
машинного обучения позволяет создавать промышленные системы
предиктивной аналитики [2].
Высокая размерность и сложная структура сигналов, обусловленная нестационарностью протекающих процессов, зашумлениями и другими факторами, затрудняет проведение анализа базовыми средствами контроля или человеком. Для анализа подобного рода данных требуются методы, учитывающие ретроспективный опыт эксплуатации, и способные адаптироваться к изменчивой динамике сигнала. Одной из основных задач в анализе технологических сигналов является задача обнаружения аномалий. Аномалия представляет собой отклонение поведения системы от стандартного [3]. Своевременное обнаружение аномалий является как основой предотвращения нештатных (аварийных) ситуаций и преждевременных отказов технологического оборудования, так и одним из способов извлечения полезной информации из сигнала.
На сегодняшний день существуют немногочисленные примеры решения задачи обнаружения аномалий с применением интеллектуального анализа в технических системах мониторинга. Одними из таких примеров являются платформа Clover - система предиктивного анализа для промышленных компаний [4], Astera - аналитическая программная платформа для цифровой промышленной трансформации [5], модуль аналитики в составе корпоративной цифровой платформы AggreGate [6].
Большинство из этих систем имеют ряд больших недостатков, такие как ограниченная применимость или примитивность методов, например, сравнение с пороговым значением.
В данной работе рассматривается проблема недостаточной изученности подходов и методов к обнаружению аномалий в многомерных технологических сигналах. Объектом исследования является процесс обнаружения аномального поведения технологического оборудования. Предметом исследования являются подходы обнаружения аномалий на основе классификации.
Таким образом целью данного исследования разработка универсального алгоритма обнаружения аномалий в многомерных технологических сигналах с импользованием аугментации данных, подбором уникального признакового пространства и классификацией.
Для достижения цели исследования необходимо решить следующие задачи:
1. Поиск и изучение научных статей и литературы по теме обнаружения аномалий в многомерных последовательных данных. Изучение соответствующих подходов для решения схожих задач.
2. Сбор, проведение первичного анализа и аугментирование данных.
3. Проектирование модели однаружения аномалий для технологических сигналов и разработка программной реализации.
4. Тестирование программной системы на реальных технологических данных и анализ полученных результатов.
При выполнении работы использовались следующие методы исследования:
1. Анализ источников, описывающих существующие подходы к решению задачи обнаружению аномалий в последовательных данных.
2. Проведение экспериментов по формированию признакового пространства, аугментации данных и классификации.
3. Расчёт, визуализация и интерпретация полученных результатов
Работа обладает следующей научной новизной:
• Предложены подходы к аугментации данных, или наложению аномалий на технологические сигналы, позволяющие решить проблему недостатка подходящих данных.
• Предложено уникальное признаковое пространство, для выполнения классификации участков сигналов на аномальные и не аномальные.
Практическая значимость исследования: предложенные подходы к аугментации данных и формированию ункального признакового пространства позволяют использовать предлгагемый подход с быстрым внедрением на реальное предпреятие, с последующим повышением качества.
Магистерская диссертация состоит из трёх разделов: в первом разделе рассматривается обзор задачи обнаружения аномалий в технологических сигналах; во втором даётся описание предлагаемой модели обнаружения аномалий в многомерных технологических сигналах; в третьем разделе описываются экспериментальные исследования, проведённые с целью оценки эффективности предлагаемого подхода обнаружения аномалий в технологических сигналах.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В работе рассмотрены вопрос идентификации аномалий в технологических сигналах с применением методов машинного обучения. Проведена аугментация реальных данных при помощи моделирования аномалий для получения тренировочных данных. Разработанная выборка покрывает большой объем сигналов и аномалий, встречающихся в реальном мире, за счёт вариации параметров моделей в широких пределах. Разработан оригинальный алгоритм обнаружения аномалий в многомерных технологических сигналах на основе преобразования исходных сигналов в наборы статистических признаков и классификации. Продемонстрирована работоспособность алгоритма и оценена точность по нескольким метрикам как на синтезированных данных, так и реальных. Исследованы зависимости параметров алгоритма для различных видов аномалий и приведены рекомендации для применения алгоритма в реальных системах.
Полученный результат на реальных данных подтверждает адекватность и достоверность предложенной модели. На основе данной модели, а также других моделей обнаружения аномалий, разработанных авторами в рамках исследования, проводится разработка прототипа модуля обнаружения аномалий в технологических сигналах. Основным преимуществом модуля является инвариантность к природе сигналов и технологических процессов описываемыми ими, исключение сложных математических моделей оборудования и возможность идентифицировать аномалии различной сложности с высокой точностью.
Результаты работы были представлены на международной конференции 15th International Conference on Machine Learning and Data Mining MLDM 2019 [44].



1 Замятин А.В., Тренькаев В.Н., Острасть П.М., Телицын Е.А. Высокопроизводительный сервер истории системы диспетчерского управления и сбора данных // ПРОМЫШЛЕННЫЕ АСУ И КОНТРОЛЛЕРЫ.
2017. № 9, С. 20-28. ISSN 1561-1531.
2 Sergey Gavrin, Damir Murzagulov, Alexander Zamyatin. Detection of Change Point in Process Signals by Cascade Classification. IEEE International Russian Automation Conference 2018
3 Шкодырев В. П. и др. Обзор методов обнаружения аномалий в потоках данных //Second Conference on Software Engineering and Information Management (SEIM-2017)(full papers). - 2017. - С. 50.
4 Clover Group. URL: https://clover. global/en/ (дата обращения: 02.11.2018)
5 Astera URL: http://astera.in/ (дата обращения: 02.11.2018)
6 AggreGate. URL: http ://aggre gate.tibbo. com/ru/ (дата обращения: 02.11.2018)
7 Антипов С. Г., Фомина М. В. Проблема обнаружения аномалий в наборах временных рядов //Программные продукты и системы. - 2012. - №. 2.
8 Шкодырев В. П. и др. Обзор методов обнаружения аномалий в потоках данных //Second Conference on Software Engineering and Information Management (SEIM-2017)(full papers). - 2017. - С. 50.
9 Chalapathy R., Chawla S. Deep Learning for Anomaly Detection: A Survey //arXiv preprint arXiv: 1901.03407. - 2019.
10 J. Ma, G. Dai, and Z. Xu, “Network Anomaly Detection Using DissimilarityBased One-Class SVM Classifier,” 2009 International Conference on Parallel Processing Workshops, Sep. 2009.
11 Liu F. T., Ting K. M., Zhou Z. H. Isolation-based anomaly detection //ACM Transactions on Knowledge Discovery from Data (TKDD). - 2012. - Т. 6. - №. 1. - С. 3.
12 Breunig M. M. et al. LOF: identifying density-based local outliers //ACM sigmod record. - ACM, 2000. - Т. 29. - №. 2. - С. 93-104.
13 H.-S. Wu, “A survey of research on anomaly detection for time series,” 2016 13 th International Computer Conference on Wavelet Active Media Technology and Information Processing (ICCWAMTIP), Dec. 2016.
14 Toledano M. et al. Real-time anomaly detection system for time series at scale //KDD 2017 Workshop on Anomaly Detection in Finance. - 2018. - С. 56-65.
15 Ceschini G. F. et al. Optimization of statistical methodologies for anomaly detection in gas turbine dynamic time series //Journal of Engineering for Gas Turbines and Power. - 2018. - Т. 140. - №. 3. - С. 032401.
..44


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ