Введение 3
1 Постановка задачи 7
1.1 Обнаружение аномалий как область анализа данных 7
1.2 Методы машинного обучения 21
1.3 Модельный подход в анализе маневров судна 30
2 Математическое моделирование и численные методы обнаружения
аномалий 32
2.1 Построение признакового пространства входных данных 34
2.2 Метод изолирующего леса 38
2.3 Матричный формализм для решения задачи идентификации ... 44
3 Программная реализация и вычислительный эксперимент 49
3.1 Архитектура и логика работы программных компонент 49
3.2 Валидация программного обеспечения 52
3.3 Вычислительный эксперимент 55
3.3.1 Обнаружение аномалий маневрирования 55
3.3.2 Обнаружение аномалий потребления топлива 58
Выводы 61
Заключение 63
Список литературы и источников 65
Приложение
В настоящее время морская область переходит к этапу цифровой трансформации [12]. Появляются и внедряются системы интернета вещей (Internet of Things, IoT), больших данных (Big Data), машинного обучения. На современном судне установлено большое количество датчиков, ведущих непрерывную запись показателей функционирования его различных подсистем. В случае организации сбора и хранения подобной информации открываются возможности применения интеллектуальных систем анализа данных. Установленные на судне датчики могут генерировать числовые данные с интервалами, варьирующимися от десяти секунд для данных телеметрии до одной минуты для навигационных параметров. Учитывая большой объем получаемой информации, становится очевидной необходимость развития автоматических систем анализа и обработки данных.
Внедрение подобных автоматических систем поддержки принятия решения в морской области в основном направлено на две группы задач. К первой относятся вопросы повышения безопасности судовождения, анализа и предупреждения опасных маневров, обнаружения нештатных режимов движения судна. Ко второй группе следует отнести экономические эффекты от оптимизации режимов потребления топлива, прогнозирование возможных поломок. Особенностью последней задачи является то, что момент обнаружения поломки не всегда соответствует её возникновению, то есть поломка может быть обнаружена не вовремя, и разность во времени между возникновением проблемы и её обнаружением может достигать нескольких недель. Решение указанных задач требует как развития инфраструктуры по сбору и хранению данных, так и разработки новых алгоритмических подходов анализа данных.
Обнаружение аномалий в данных было изучено в статистическом сообществе уже в XIX веке [40]; со временем в нескольких исследовательских группах были разработаны методы обнаружения аномалий, часть из которых имела узкие области применения [13, 60], в то время как прочие подходы были междисциплинарными [31, 32, 54].
Обнаружение аномалий (Anomaly Detection) относится к проблеме поиска образцов данных, которые не соответствуют определенному понятию нормального поведения и называются аномалиями, выбросами, противоречивыми наблюдениями, исключениями, особенностями или загрязнениями в разных областях применения. Задачи обнаружения аномалий не имеют единой формулировки и часто интерпретируются различным образом в зависимости от поставленной цели и характера данных [19, 45]. Важность обнаружения
аномалий обусловлена тем фактом, что они преобразуются в значительную, часто критически важную информацию с использованием в разных областях применения. Становится актуальной необходимость разработки методов, способных на основе анализа поведения процесса прогнозировать возникновение нештатных ситуаций в динамических системах.
Обнаружение новизны в данных (Novelty Detection) является другой проблемой, связанной с детектированием аномалий и направленной на обнаружение ранее не наблюдаемых шаблонов в данных, которые в отличие от выбросов (Outlier Detection), обычно включаются в нормальную модель после их обнаружения [71].
Целью работы является разработка методов поиска аномалий в сенсорных данных, а также исследование свойств и апробация алгоритмов на задаче анализа движения морских судов.
Для достижения указанной цели необходимо решить ряд задач.
1. Выявление актуальных направлений в области прогнозирования аномальных событий применительно к анализу движения морских судов.
2. Построение математической модели обнаружения аномалий маневрирования и потребления топлива для морских судов.
3. Реализация программного инструментария для обработки и анализа данных на основе построенной математической модели.
4. Проведение вычислительного эксперимента на основе сенсорных данных с морских судов и анализ полученных результатов.
Методы исследования в данной работе основываются на фундаментальных положениях интеллектуального анализа данных, теории временных рядов и теории машинного обучения. Объектом исследования являются методы: теории интеллектуального анализа данных. Предметом исследования являются модели, методы и алгоритмы автоматического обнаружения и прогнозирования аномалий в сенсорных данных. Научная новизна исследования заключается в решении актуальной задачи обнаружения и прогнозирования аномалий в сенсорных данных.
Публикации. Основные результаты исследования отражены в двух статьях в изданиях, рекомендованных ВАК РФ; опубликованы 1 работа в издании, индексируемом Scopus, и 1 работа в сборнике конференции, индексируемой в РИНЦ. Также получено свидетельство о регистрации программы на ЭВМ «Полифит: полиномиальная нейронная сеть».
В выпускной квалификационной работе аспиранта проведено исследование в области выявления аномалий маневрирования и потребления топлива на примере анализа данных движения морских судов. В рамках исследования продемонстрировано применение методов изолирующего леса и полиномиальных нейронных сетей для задач обнаружения аномалий маневрирования морских судов. Также построена и протестирована модель прогнозирования потребления топлива на основе навигационных данных. Стандартная реализация алгоритма изолирующего леса взята из библиотеки scikit-learn и модифицирована с учетом требований предварительной фильтрации входных данных. Алгоритмы на основе полиномиальных нейронных сетей реализованы автором в виде библиотеки на основе вычислительной платфорсы TensorFlow.
Приведенные математические выкладки построения математической модели предоставляют строгий аппарат для построения и исследования полиномиальных нейронных сетей, задаваемых матричным преобразованием Ли. Полученные в работе результаты демонстрируют возможность применения рассмотренной нейронной сети в качестве модели машинного обучения для решения задач восстановления регрессии, а также приближенной оценки общего решения систем обыкновенных дифференциальных уравнений.
Дальнейшим развитием рассмотренного подхода являются его обобщение на теорию дифференциальных уравнений в частных производных и уравнения с запаздыванием, а также развитие специализированных эффективных методов обучения полиномиальных нейронных сетей. Также важной является необходимость теоретических оценок точности и сходимости рассмотренного подхода. Идентификация систем, описываемых уравнениями в частных производных, может вестись на основе внедрения аппарата дифференциальной алгебры. Уравнения с запаздыванием потенциально могут моделироваться рекуррентными нейронными сетями.
Таким образом, в данной работе были получены следующие результаты.
1. Проведена обработка полученных сенсорных данных для повышения устойчивости работы алгоритмов поиска аномалий и масштабирования на разные типы судов.
2. Разработана математическая модель обнаружения аномалий маневрирования и потребления топлива для морских судов.
3. На основе построенной математической модели реализован программный инструментарий.
4. Проведена апробация методов на примере решения задачи идентификации маневрирования судна.
В работе определен ряд трудностей, возникающих в процессе применения алгоритмов, приведены варианты их решения и возможные пути дальнейшего развития подходов. Реализация этих методов позволит в будущем перейти как к задачам анализа больших данных, собираемых с судов, так и к внедрению подобных алгоритмов непосредственно на борту судна с целью уменьшения передаваемого объема информации.
1. Андрианов С. Н. Динамическое моделирование систем управления
пучками частиц. — Изд-во СПбГУ, СПб. — 2004. — 368 с.
2. Вагущенко Л.Л. Современные информационные технологии
в судовождении. Электронное учебное пособие. — Одесса: ОНМА. —
2013. — 135 с.
3. Вороновский Г. К., Махотило К. В., Петрашев С. Н, Сергеев С. А. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. — Х.: ОСНОВА. — 1997. — 112 с.
4. Воронцов К. В. Лекции по методу опорных векторов от 21 декабря 2007 года. URL: http://www.ccas.ru/voron/download/svm.pdf.
5. Демидович Б. П., Марон И. А., Шувалова Э. З. Численные методы анализа 3-е изд. — М.: Наука. — 1967.
6. Заварзин Д. В. К вопросу поиска аномалий во временных рядах // Инновации в науке: сб. ст. по матер. XXIX междунар. науч.-практ. конф, Новосибирск: СибАК. — 2014. — № 1(26). — C. 59-64.
7. Зубков Е.В., Белов В.М. Методы интеллектуального анализа данных и обнаружение вторжений // Вестник СибГУТИ. — 2016. — № 1.
8. Иванов А. Н. Интегрированная среда моделирования спин-орбитального движения заряженных частиц // Вестн. С.-Петерб. ун-та. Сер. 10: прикладная математика, информатика, процессы управления. — 2014. — № 2. — С. 49-60.
9. Иванов А. Н., Кузнецов П. М. Идентификация динамических систем на основе нелинейного матричного преобразования Ли // Вестник УГАТУ. —
2014. — Т. 18, № 2(63). — С. 251-256.
10. Лепский А. Е., Броневич А. Г. Математические методы распознавания образов. Курс лекций. URL: http://window.edu.ru/resource/800/73800/files/ lect_Lep skiy_Bronevich_pass .pdf.
11. Лифшиц Ю. Метод опорных векторов. URL: http://logic.pdmi.ras.ru/~yura /internet/07ia.pdf
12. Пинский А. С. Е-Навигация и безэкипажное судовождение // Транспорт РФ. — 2016. — №4 (65). — С. 50-54.
13. Суханов А. В, Ковалев С. М. Метод нахождения аномалий при диагностике верхнего строения пути // Программные системы и вычислительные методы.— 2013. — № 2(3). — С. 176-180.
14. Шкодырев В. П., Ягафаров К. И., Баштовенко В. А., Ильина Е. Э. Обзор методов обнаружения аномалий в потоках данных // Proc. of the Second Conference on Software Engineering and Information Management, Санкт- Петербург, Россия. — 2017. — Vol. 1864. — 7 c.
15. Шолохова А. А. Поиск аномалий в сенсорных данных на примере анализа движения морского судна // Моделирование, оптимизация и информационные технологии. — 2017. — №3(18). — 13 с.
16. Шолохова А. А. Полифит: полиномиальная нейронная сеть. Роспатент. Свидетельство №2018610385 от 10.01.2018.
17. Шолохова А. А., Иванов А. Н. Выполнение научно -исследовательских
работ аспирантами в сотрудничестве с ИТ -компаниями // Материалы XI (1) всероссийской научно-практической конференции «Цифровые
технологии в образовании, науке, обществе». — 2017. — С. 178-180.
18. Шолохова А. А., Иванов А. Н. Моделирование динамических систем на основе полиномиальных нейронных сетей // Моделирование, оптимизация и информационные технологии. — 2017. — №4(19). — 11 c.
19. Aggarwal, C. C. Outlier analysis // Springer Science & Business Media. —
2013. — P. 455.
20. Agyemang, M., Barker, K., and Alhajj, R. A comprehensive survey of numeric and symbolic outlier mining techniques // Intelligent Data Analysis. — 2006. — Vol. 10, no. 6. — Pp. 521-538.
21. Akaike, H. Fitting autoregressive models for prediction // Annals of the Institute of Statistical Mathematics, Springer; The Institute of Statistical Mathematics. — 1969. — Vol. 21, no 1. — Pp. 243-247.
22. Bakar, Z.,Mohemad, R., Ahmad, A., and Andderis, M. Acomparative study for outlier detection techniques in data mining // Proceedings of the IEEE Conference on Cybernetics and Intelligent Systems. — 2006. — Pp. 1-6.
23. Barnett, V. and Lewis, T. Outliers in Statistical Data. — J. Wiley & Sons., 3rd edition. — 1994. — XVII. — P. 582.
24. Beckman, R. J., and Cook, R. D. Outlier...s // Technometrics. — 1983. —
Vol. 25, no 2. — Pp. 119-149.
25. Bilge, L., and Dumitras, T. Before we knew it: an empirical study of zero-day attacks in the real world // ACM Conference on Computer and Communications Security, Raleigh, NC. — 2012. — Pp. 833-844.
26. Bishop, C. M. Neural networks for pattern recognition. — Oxford University Press, Oxford. — 1995. — P. 482.
27. Bishop, C. M. Pattern recognition and machine learning. — Springer
Information Science and Statistics. —2006. — P. 761.
28. Borne, K. D. Effective Outlier Detection using K-Nearest Neighbor Data Distributions: Unsupervised Exploratory Mining of Non-Stationarity in Data Streams // Submitted to the Machine Learning Journal. — March 2010.
29. Brandswter, A., Manno, G., Vanem, E. & G., Ingrid, K. An application of sensor-based anomaly detection in the maritime industry // IEEE International Conference on Prognostics and Health Management (ICPHM 2016). — 2016. — Pp. 1-8.
30. Breiman, L., Friedman, J. H., Olshen, R. A., and Stone, C. J. Classification and regression trees. — Wadsworth Books. — 1984. P. 358.
31. Chandola, V., Banerjee, A., and Kumar, V. Anomaly detection: A survey // ACM Computing Surveys (CSUR). — 2009. — Vol. 41, №. 3, Article 15 (July 2009).
— P. 58.
32. Chandola, V., Banerjee, A., and Kumar, V. Anomaly detection for discrete sequences: A survey // IEEE Transactions on Knowledge and Data Engineering. — 2012. — Vol. 24, no. 5. — Pp. 823-839.
33. Chapelle, O., Scholkopf B., and Zien, A. Semi-Supervised Learning. Adaptive Computation and Machine Learning series. — The MIT Press, Cambridge. —
2006. — P. 501.
34. Chen S., and Billings S.A. Neural networks for nonlinear dynamic system modelling and identification // International Journal of Control. — 1992. — Vol. 56, no. 2. — Pp. 319-346.
35. Clark, I.C. Ship dynamics for mariners. — The Nautical Institute. — 2005. — P. 300.
36. Cunningham, P., Cord, M., Delany, S. J. Supervised Learning // Machine Learning Techniques for Multimedia. — Springer Berlin Heidelberg. — 2008. — Pp. 21-49.
37. Cybenko, G. V. Approximation by Superpositions of a Sigmoidal function // Mathematics of Control Signals and Systems. — 1989. — Vol. 2., issue 4. — Pp. 303-314.
38. Das, S., Wong, W-K., Dietterich, T., Fern, A. and Emmott, A. Incorporating Expert Feedback into Active Anomaly Discovery // Proceedings of the IEEE 16th International Conference on Data Mining. — 2016. — Pp. 853-858.
39. Dragt, A. J. Lie methods for nonlinear dynamics with applications to accelerator physics // University of Maryland, Center for Theoretical Physics, Department of Physics. — 2011.
40. Edgeworth, F. Y. On discordant observations // The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science . — 1887. — Vol. 23, no. 5. — Pp. 364-375.
41. Fox, A. J. Outliers in time series // Journal of the Royal Statistical Society. — 1972. — Series B (Methodological) 34, no. 3. — Pp. 350-363.
42. Harrou, F., Kadri, F., Chaabane, S., Tahon, C., and Sun, Y. Improved principal component analysis for anomaly detection: Application to an emergency department // Computers & Industrial Engineering. — 2015. — Vol. 88. — Pp. 63 — 77.
43. Hastie, T., Tibshirani, R., and Friedman, J. The EM algorithm // The Elements of Statistical Learning. New York: Springer, — 2001. — Pp. 236-243.
44. Hawkins, D. Identification of Outliers. — Springer Netherlands. — 1980. — P. 195.
45. He, Z., Deng, S., Xu, X., and Huang, J. Z. Fp-outlier: Frequent pattern based outlier detection // Computer Science and Information Systems. — 2005. — Vol. 2, no. 1. — Pp. 103-118.
46. Ho, Tin Kam. Random Decision Forests // Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC. — 1995. — Pp. 278-282.
47. Hodge, V. and Austin, J. A survey of outlier detection methodologies // Artificial Intelligence Review. — 2004. — Vol. 22, no. 2. — Pp. 85-126.
48. http://scikit-learn.org/stable/index.html
49. Ivanov, A., Andrianov, S., Kulabukhova, N., Sholokhova, A., Krushinevskii, E., Sboeva, E. Matrix representation of Lie transform in TensorFlow // Proceedings of IPAC2018, Vancouver, DC, Canada. — 2018. — P 3.
50. Kaelbling, L. P., Littman, M. L., and Moore, A. W. Reinforcement Learning: A Survey // Journal of Artificial Intelligence Research. — 1996. — Vol. 4. — Pp. 237-285.
51. Khan, S. S., and Madden, M. G. A survey of recent trends in one class classification // Artificial Intelligence and Cognitive Science, Springer Berlin Heidelberg. — 2010. — Pp. 188-197.
52. Klerx, T., Anderka, M., Buning, H. K., and Priesterjahn S. Model-Based Anomaly Detection for Discrete Event Systems // IEEE 26th International Conference on Tools with Artificial Intelligence, Limassol. — 2014. — Pp. 665¬672.
53. Knorr, E. M., Ng, R. T., and Tucakov, V. Distance-based outliers: Algorithms and applications // The VLDB Journal the International Journal on Very Large Data Bases. — 2000. — Vol 8, 3-4. — Pp. 237-253.
54. Kovalev, S., Sukhanov, A., and Styskala, V. Fuzzy model based intelligent prediction of objective events // Advances in Intelligent Systems and Computing. — 2016. — Pp. 23-33.
55. Kreyszig, E. Advanced Engineering Mathematics. — John Wiley & Sons Inc, 4th edition, — 1979. — P. 880.
56. Lagaris, I. E., Likas, A., and Fotiadis, D. I. Artificial neural networks for solving ordinary and partial differential equations // IEEE Transactions on Neural Networks. — 1998. —Vol. 9, no. 5. — Pp. 987- 1000.
57. Lapedes, A., and Farber, R. Nonlinear signal processing using neural networks: Prediction and system modeling // Technical Report LA-UR87-2662, Los Alamos National Laboratory, Los Alamos, New Mexico. — 1987.
58. Laxman, S. and Sastry, S. P. A survey of temporal data mining // SADHANA, Academy Proceedings in Engineering Sciences. — 2005. — Vol. 31, №. 2. — Pp. 173-198.
59. Lewis, F. L., and Ge, S. S. Neural Networks in Feedback Control Systems // Mechanical Engineer’s Handbook, Instrumentation, Systems, Controls, and mMEMS, John Wiley, New York. — 2006. — Book 2, chapter 19. — P. 28.
60. Li, Y, Wang Y. A misuse intrusion detection model based on hybrid classifier algorithm // International Journal of Digital Content Technology and its Applications, Advanced Institute of Convergence Information Technology. —
2012. — Vol. 6, no. 5. — Pp. 25-33.
61. Liu, Y. and Ding, W. A KNNS based anomaly detection method applied for UAV flight data stream // Prognostics and System Health Management Conference (PHM), Beijing. — 2015. — Pp. 1-8.
62. Liu, T., Ting, K. M., and Zhou, Z. Isolation Forest // Proceeding of the Eighth IEEE International Conference on Data Min ing . — 2008. — Pp. 413-422.
63. Mall, S., and Chakraverty, S. Comparison of artificial neural network architecture in solving ordinary differential equations // Advances in Artificial Neural Systems. — 2013. — Pp. 1-12.
64. Markou, M. and Singh, S. Novelty detection: A review-part 1: Statistical approaches // Signal Processing. — 2003a. — Vol. 83, issue 12. — Pp. 2481-2497.
65. Markou, M. and Singh, S. Novelty detection: A review-part 2: Neural network based approaches // Signal Processing. — 2003b. — Vol. 83, issue 12. — Pp. 2499-2521.
66. Muller, A.C., and Guido, S. Introduction to Machine Learning with Python: A Guide for Data Scientists. — O'Reilly. — 2017. — P. 396.
67. Murthy, S. K. Automatic construction of decision trees from data: A multidisciplinary survey // Data Mining and Knowledge Discovery. — 1997. — Vol. 2. — Pp. 345-389.
68. Newman, J. N. Marine hydrodynamics. — Cambridge, Massachusetts: MIT Press. — 1977. — P. 389.
69. Omar, S., Ngadi, A., and Jebur, H. Machine Learning Techniques for Anomaly Detection: An Overview // International Journal of Computer Applications. —
2013. — Vol. 79, no. 2. — Pp. 33-41.
70. Patcha, A., and Park J. M. An overview of anomaly detection techniques: Existing solutions and latest technological trends // Computer Networks. —
2007. — Vol. 51, no. 12. — Pp. 3448-3470.
71. Pimentel, M.A.F., Clifton, D.A., Clifton, L., and Tarassenko, L. A review of novelty detection // Signal Processing 99. — 2014. — Pp. 215-249.
72. Raileanu, L. E., and Stoffel, K. Theoretical Comparison between the Gini Index and Information Gain Criteria // Annals of Mathematics and Artificial Intelligence. — May 2004. — Vol. 41, no. 1. — Pp. 77-93.
73. Ramaswamy S., Rastogi R., and Shim, K. Efficient algorithms for mining outliers from large data sets // Proceedings of the ACM SIGMOD International
Conference on Management of Data - SIGMOD '00. — 2000. — ACM Press.
— Pp. 427-438.
74. Rokach, L., and Maimon, O. Data mining and knowledge discovery handbook. — Springer US. — 2005. — Pp. 1285.
75. Rousseeuw, P. J. and Leroy, A. M. Robust Regression and Outlier Detection. — Wiley-Interscience, New York (Series in Applied Probability and Statistics). — 1987. — 329 pp.
76. Rousseeuw, P.J., and Van Driessen, K. A Fast Algorithm for the Minimum Covariance Determinant Estimator // Technometrics. — 1999. — Vol. 41. — Pp. 212-223.
77. Russell, S. J., and Norvig, P. Artificial Intelligence: A Modern Approach. — Prentice Hall. — 2009 (3rd Ed.). — P. 1152.
78. Samuel, A. L. Some Studies in Machine Learning Using the Game of Checkers //
IBM Journal of Research and Development. — 1959. — Vol. 44, no. 1.2. —
Pp. 335-365.
79. Santosh, D. H. H., Venkatesh, P., Patruni, P., Rao, L. N., and Kumar, N. A.
Tracking Multiple Moving Objects Using Gaussian Mixture Model //
International Journal of Soft Computing and Engineering (IJ SCE). — 2013. — Vol. 3, no. 2. — Pp. 114-119.
80. Scholkopf, B., Platt, J. C., Shawe-Taylor, J. C., Smola, A. J., and Williamson, R. C. Estimating the Support of a High-dimensional Distribution // Neural Computation. — 2001. — Vol. 13, issue 7. — Pp. 1443-1471.
81. Settles, B. Active Learning Literature Survey // Computer Sciences Technical Report 1648, University of Wisconsin-Madison. — 2010. — P. 67.
82. Siddique, N., and Adeli, H. Evolutionary Neural Networks // Computational Intelligence: Synergies of Fuzzy Logic, Neural Networks and Evolutionary Computing. — 2013. — Pp. 307-355.
83. Simon, L., and Rinehart, A.W. A Model-Based Anomaly Detection Approach for Analyzing Streaming Aircraft Engine Measurement Data // Technical
Report 2015-218454, NASA. — 2015. URL: ntrs.nasa.gov/archive/nasa/
casi.ntrs.nasa.gov/20150000721.pdf
84. Song, X, Wu, M., Jermaine, C., and Ranka, S. Conditional anomaly detection // IEEE Transactions on Knowledge and Data Engineering. — 2007. — Vol. 19, no. 5. — Pp. 631-645.
85. Tsitsiklis, J. Asynchronous Stochastic Approximation and Q-learning // Machine Learning. — 1994. — Vol. 1, no. 3. — Pp. 185-202.
86. Tu, E., Zhang, G., Rachmawati, L., Rajabally, E., and Huang, G. B. Exploiting AIS Data for Intelligent Maritime Navigation: A Comprehensive Survey From Data to Methodology // IEEE Transactions on Intelligent Transportation Systems. — 2017. — Vol. 19, no. 5. — Pp. 1559-1582.
87. Wei, W.W.S. Time series analysis: Univariate and Multivariate Methods. — Addison-Wesley Publishing Company, Inc., New York. — 1990. — P. 624.
88. Zadeh, L.A. Fuzzy sets // Information and control. — 1965. — Vol. 8, no. 3. — Pp. 338-353.
89. Zhu, Xiaojin. Semi-supervised learning literature survey // Technical Report 1530, Department of Computer Sciences, University of Wisconsin, Madison. —
2005. — P. 60.