Введение 3
Постановка задачи 4
Обзор литературы 5
Глава 1. Обзор существующих решений 6
1.1. Интуитивный и нормативный подходы 6
1.2. Коммерческие предложения 7
Глава 2. Анализ данных 8
2.1. Источник данных 8
2.2. Описание данных 8
2.3. Предобработка исходных данных 8
Глава 3. Методы прогнозирования в PdM 12
3.1. Методы и модели прогнозирования 12
3.2. Линейная регрессия 15
3.3. Регрессионные деревья 16
3.3.1 Случайный лес 17
3.4. Рекуррентные нейронные сети 19
3.4.1 LSTM 21
3.4.2 Проблемы обучения глубоких нейронных сетей 25
Глава 4. Реализация модели прогнозирования 26
4.1. Инструменты реализации 26
4.2. Выбор метрик 27
4.3. Построение моделей 28
4.4. Сравнение работы моделей 32
4.5. Программный комплекс 34
4.5.1 База данных 35
4.5.2 Функционал приложения 36
Выводы 37
Заключение 37
Список литературы
На сегодняшний день многие крупные компании нуждаются в оптимизации производственных процессов. Приоритетными вопросами все чаще оказываются следующие задачи: повышение качества продукции, эксплуатационная безопасность, а также снижения издержек. С внедрением технологий больших данных (Big Data), системы интернета вещей (Internet of Things, IoT) и машинного обучения, прогнозная аналитика стала перспективной и быстроразвивающейся областью.
Внедрение технологии PdM (predictive maintenance, предиктивное обслуживание) в рамках технического обслуживания и инжиниринга в основном направлено на две группы задач. К первой относятся прогнозирование возможных поломок: определение аномальных режимов работы агрегатов, предсказание безопасного остаточного срока службы компонентов. Ко второй группе следует отнести предотвращение возникновения отказа оборудования путем выполнения технического обслуживания. Контроль за возможным отказом системы позволяет планировать техническое обслуживание до того, как произойдет отказ, что позволяет сократить необходимость в реализации внепланового ремонта, а также минимизировать риск поломок оборудования.
Незапланированный простой оборудования может причинить ущерб любому предприятию. Важно поддерживать рабочее состояние используемого оборудования, чтобы обеспечить максимально эффективное использование ресурсов и минимизировать время дорогостоящих незапланированных простоев, а также риски, связанные с работоспособностью и безопасностью. Целью стратегии прогнозного обслуживания является увеличение полезного срока службы оборудования и предотвращение сбоев. Часто используется обнаружение аномалий в работе устройств, потому что с его помощью можно определить, когда устройство ведет себя не так, как ожидалось.
При внедрении подобных технологий необходимо организовать сбор и хранения важной для исследований информации. По мере развития средств промышленного интернета вещей, в частности, благодаря оснащению оборудования различными датчиками, сбор данных о его техническом состоянии выполняется не периодически, а непрерывно, без приостановки эксплуатации оборудования. Так, современные разработки позволяют записывать огромные массивы данных с показателей датчиков, установленных на оборудовании прямо во время работы, а по завершению получать информацию о работе всех компонентов. Учитывая большой объем получаемой информации, становится очевидной необходимость развития автоматических систем анализа и обработки данных. Поэтому, решение указанных задач требует как развития инфраструктуры по сбору и хранению данных, так и разработки новых алгоритмических подходов анализа данных.
Постановка задачи
Целью данной работы является разработка модели и программного модуля, позволяющего в режиме реального времени по данным, полученным с IoT устройств, предсказывать Remaining Useful Life (RUL) - количество оставшихся рабочих циклов до отказа системы, т. е. количество рабочих циклов после последнего выполненного цикла, в течение которого оборудование будет продолжать работать.
Для достижения цели были поставлены следующие задачи:
1. обзор существующих подходов и практик по прогнозированию сбоев оборудования;
2. предобработка и анализ исходных данных;
3. описание моделей прогнозирования, выявление преимуществ и недостатков;
4. описание архитектуры рекуррентных нейронных сетей LSTM;
5. разработка модели машинного обучения, основанной на использовании системы LSTM;
6. сравнение результатов прогнозирования различных моделей;
7. разработка программного модуля по прогнозированию сбоев оборудования;
На сегодняшний день, в погоне за эффективным использованием ресурсов, предприятиям необходимо развивать технологии гибкого планирования технического обслуживания. Прогнозирование сбоев оборудования и остаточного срока службы систем является актуальной областью исследований, ведь в России предиктивная аналитика только набирает обороты и индустриальный сектор все активнее применяет PdM. Однако, до сих пор нет программного комплекса, который бы полностью решал данную задачу. Хотя в данном направлении и ведутся активные разработки, но перед исследователями стоит ряд проблем, которые затрудняют реализацию проектов. К примеру, медленное развитие технологий IoT, которые выступают необходимыми техническими компонентами в реализации поставленной задачи. Так, большая часть оборудования на заводах не оснащена датчиками для передачи информации, на предприятиях нет систем сбора данных и онлайн-мониторинга. К тому же на производствах журналы с информацией о дефектах и ремонтах зачастую ведутся некорректно. Неготовность персонала к IT-решениям и недоверие к новой концепции обслуживания сдерживают внедрение PdM-систем.
В данной работе на основе имеющихся данных было предложено решение для гибкого планирования технического обслуживания, оно включает в себя программный комплекс, способный прогнозировать остаточный срок службы оборудования на производстве в условиях реального времени. В качестве продолжения данной работы можно сформулировать и решить задачу классификации: по состоянию оборудования на текущей момент определять, может ли оно быть допущено в эксплуатацию, что позволит эффективнее принимать решение о безопасности его использования, исключая человеческий фактор полностью. Это требует дополнительных исследований по установлению безопасного доверительного интервала, для реализации необходимо привлечение специалистов, а также большего массива исторических данных.
[1] Diamond S., Marfatia A. Predictive maintenance for dummies. Hoboken, 2013. 44 p.
[2] Poor P., Basl J. Predictive Maintenance 4.0 as next evolution step in industrial maintenance development. // 2019 International Research Conference on Smart Computing and Systems Engineering (SCSE), Colombo, Sri Lanka. 2019. P. 245-253.
[3] Чучуева И.А. Модель прогнозирования временных рядов по выборке максимального подобия: дис. ... канд. техн. наук: 05.13.18. Моск. гос. техн. ун-т им. Н.Э. Баумана Москва, 2012. 154 с.
[4] Андрюхин Е.В., Ридли М.К., Правиков Д.И. Прогнозирование сбоев и отказов в распределённых системах управления на основе моделей прогнозирования временных рядов // Вопросы кибербезопасности, 2019, №3. С. 24-32.
[5] Шаханов Н.И., Варфоломеев И.А., Ершов Е.В., Юдина О.В. Прогнозирование отказов оборудования в условиях малого количества поломок // Вестник Череповецкого государственного университета, 2016, № 6. С. 36-41.
[6] Хайкин С. Нейронные сети. Полный курс. : И.Д. Вильямс , 2016. 1104 с.
[7] Horichreiter S., Schmidhuber J. Long short-term memory // Neural Computation, 1997, № 9. P. 1735-1780.
[8] Имильбаев Р. Р. Методы и алгоритмы прогнозирования значений контролируемых параметров газораспределительной сети по результатам обработки телеметрической информации: дис. ... канд. техн. наук: Уф. гос. нефт. техн. ун-т Уфа, 2018. 152 с.
[9] Saxena A., Goebel K. Damage propagation modeling for aircraft engine run-to-failure simulation. // 2008 International Conference on Prognostics and Health Management, Denver, CO. 2008. P. 1-9.
[10] Cielen D., Meysman A., Ali M. Introducing Data Science Big Data, Machine Learning, and more, using Python tools, 2016. P. 22-48.
[11] Documentation Pandas python.http://pandas.pydata.org/pandas-docs/version/0.15.2/tutorials.html
[12] Documentation scikit-learn python.http://scikit-learn.org/stable/tutorial/index.html
[13] Documentation Keras models.https://keras.io/models/about-keras-models
[14] Стрижов В. В. Методы индуктивного порождения регрессионных моделей: ВЦ РАН. 2008. 55 с.
[15] Tibshirani R. J. Regression shrinkage and selection via the lasso // Journal of the Royal Statistical Society. Series B (Methodological), 1996. Vol. 58, No. 1. P. 267-288.
[16] Чистяков С. П. Случайные леса: обзор // Труды Карельского научного центра Российской академии наук, 2013 № 1. С. 117-136.
[17] Breiman L. Bagging predictors // Machine Learning, 1996. Т. 24, вып. 2. С. 123-140.
[18] Skurichina M., Duin R. P. W. Limited bagging, boosting and the random subspace method for linear classifiers// Pattern Analysis and Applications, 2002. Vol. 5, No. 2, P. 121-135.
[19] Hochreiter S. The vanishing gradient problem during learning recurrent neural nets and problem solutions // International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 1998. Vol. 6, No 2. P. 107-116.
[20] Hochreiter S., Bengio Y., Frasconi P., Schmidhuber J. Gradient flow in recurrent nets: the difficulty of learning long-term dependencies. In A Field Guide to Dynamic Recurrent Neural Networks. IEEE Press, 2001.
[21] Molchanov D., Ashukha A., Vetrov D. P. Variational dropout sparsifies deep neural networks // Proceedings of the 34th International Conference on Machine Learning, ICML, 2017, P. 2498-2507.
[22] Goodfellow I., Bengio Y., Courville A. Deep Learning: MIT Press, 2016. 775 p.