АННОТАЦИЯ 3
ВВЕДЕНИЕ 5
1. Прогноз погоды. Основные положения 7
1.1 История развития 8
1.2 Современные системы прогнозирования погоды 9
1.3 Методы прогноза погоды 10
1.4 Главные метеорологические центры 12
2. Машинное обучение и его направления 13
2.1 Понятие машинного обучения в искусственном интеллекте 13
2.2 Алгоритмы машинного обучения и их типы 14
2.3 Ключевые алгоритмы машинного обучения 16
2.4 Нейронные сети 20
2.5 Рекуррентные нейронные сети 24
3. Исследовательская часть 28
3.1 Обзор инструментов для машинного обучения и обработки данных .... 28
3.2 Характеристика исходного и расчетного материала 30
3.3 Суточные амплитуды воздуха и межсуточные разности максимальных
температур, возможные на территории исследования 31
3.4 Устройство модели прогнозирования 32
3.5 Оценка моделей 33
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 42
Погода имеет очень важное значение в человеческой жизни. С развитием цивилизации важность прогноза погоды для человечества только продолжает увеличиваться.
Современные гидродинамические модели циркуляции атмосферы позволяют давать детализированные по времени суток прогнозы погоды различного времени действия. Оценки показывают, что высокую достоверность (более 80%) имеют прогнозы на 5 суток. Сегодня различные метеорологические синтезирующие центры в экспериментальном порядке рассчитывают прогнозы погоды на сроки и более 5 суток, но такие прогнозы имеют низкую точность и достоверность и рассматривать их следует лишь как возможный сценарий развития погоды, вероятность осуществления которого ниже уровня 50%.
В настоящее время распространены автоматизированные системы мониторинга метеопараметров атмосферы на глобальном или национальном уровнях.
Но такие системы являются чрезвычайно сложными и дорогими в реализации и не обеспечивают нужной точности прогнозирования для множества локальных территорий (район, город). Поэтому возможен другой подход процесса прогнозирования на основе систем мониторинга, построенных по принципу сбора и обработки информации с локального до национального уровней. Для этого необходимо создание локальных автоматизированных пунктов по наблюдению, накоплению данных о метеопараметрах атмосферы и прогнозированию. Используя такую схему создания прогноза и учитывая данные прогноза, полученные в мировых центрах прогнозирования, можно получить более достоверные прогнозы как для региона, так и для всей страны. В целом, такая схема прогнозирования будет также более проста в реализации и более экономна.
На сегодняшний день методы машинного обучения получили довольно большую известность и применяются практически во всех сферах деятельности. Круг задач, решаемых с помощью искусственных нейронных сетей довольно широкий. Сюда можно отнести классификацию и распознавание некоторых образов, кластеризацию, оптимизацию, а также предсказания и прогнозирование.
В этой работе будут рассмотрены основные положения из теории машинного обучения, будут затронуты основные проблемы сбора и анализа данных.
Целью данной работы является подбор рекуррентной нейронной сети и исследование ее способности к прогнозированию временных рядов на примере различных метеорологических параметров
Для достижения поставленной цели необходимо выполнить следующие задачи:
• Создать исходный массив данных сеточного масштаба на основе данных реанализа ERA5;
• Подобрать архитектуру и гиперпараметры модели для прогноза с заблаговременностью 9 и 12 часов;
• Исследовать различные методы обучения модели нейронной сети;
• Протестировать точность прогнозирования при различных конфигурациях;
• Выявить наиболее оптимальную модель и конфигурацию сети;
• Провести валидацию результатов модели.
В ходе исследования были проанализированы основные классификации моделей машинного обучения и их особенности. Далее были описаны различные способы оценки построенной модели и выбраны подходы к повышению их качества применительно к извлеченным данным.
В ходе выполнения выпускной квалификационной работы была достигнута основная цель работы - разработан автономный программный комплекс для прогнозирования временных рядов на основе алгоритмов искусственных рекуррентных сетей.
Данная разработка позволит увеличить точность и эффективность прогнозирования различных величин, измеряемых во времени. Так, например, точное прогнозирование метеорологических параметров сможет сказать о приближении каких-либо природных катаклизмов, а также может быть полезно в сфере сельского хозяйства, где погодные условия оказывают ключевое влияние на эффективность деятельности.
В результате проделанной работы можно сделать выводы что оценки тренировочной выборки на 100% совпадают с оценками тестовой выборки в обоих прогнозах - на 9 и 12 часов, что говорит о хорошем результате работы модели. На прогнозируемой территории в зависимости от расположения и времени года сильно разнятся значения средней суточной амплитуды воздуха, но модель отлично справляется с этими задачами. В условиях резкой смены погоды погрешность модели вырастает, но в среднем не превышает 2-3 °. С увеличением заблаговременности прогноза, идет нарастание ошибки. Эту модель можно усовершенствовать. Чтобы она лучше работала при значительной межсуточной амплитуде нужно рассчитать другие показатели атмосферы, тогда мы сможем определять индексы неустойчивости атмосферы и прочие явления.
В процессе разработки были выполнены все поставленные ранее задачи:
Создан исходный массив данных сеточного масштаба на основе
данных реанализа ERA5;
• Подобрана архитектура и гиперпараметры модели для прогноза с заблаговременностью 9 и 12 часов;
• Исследованы различные методы обучения модели нейронной
сети;
• Протестирована точность прогнозирования при различных конфигурациях;
• Выявлена наиболее оптимальная модель и конфигурация сети;
• Проведена валидация результатов модели.
1. Полякова Л.С., Кашарин Д.В. Учебное пособие «Метеорология и климатология». Новочеркасск: НГМА, 2004. - 107с.
2. Weather Prediction by Numerical Process (Cambridge Mathematical Library) 2nd edition (August 13, 2007)
3. Gopika S. Machine learning Approach of Chronic Kidney Disease Prediction using Clustering Technique / S. Gopika, Dr.M. Vanitha // International Journal of Innovative Research in Science, Engineering and Technology. - 2017. - Vol. 6, No. 7. - P. 14488-14496.
4. Воробьев В.И. Синоптическая метеорология. Ленинград: Гидрометеоиздат, 1991. - 604с.
5. Мировых метеорологических центров стало больше / Фобос // Метеовести. — 2017.
6. Чучуева, И. История развития моделей прогнозирования погоды / И. Чучуева // Математическое бюро. — 2013.
7. A. L. Samuel Some Studies in Machine Learning Using the Game of Checkers. II-Recent Progress
8. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных / пер. с англ. А.А. Слинкина.
- М.: ДМК Пресс, 2015. - 400 с.
9. Alahi A. et al. Social lstm: Human trajectory prediction in crowded spaces // Proceedings of the IEEE conference on computer vision and pattern recognition.
- 2016. - С. 961-971.
10. Хайкин С. Нейронные сети: Полный курс / пер. с англ. Н.Н. Куссуль,А.Ю. Шелестова. - 2-е изд., испр. - М.: Издательский дом Вильямс, 008. - 1103 с.
11. Прогнозирование временных рядов с помощью нейронной сети // GitHub. URL: https://github.com/liveisgood8/NeuralNetwork (дата обращения: 20.04.2022)
12. Вандерплас Д. Python для сложных задач: наука о данных и машинное обучение. - СПб.: Питер, 2018. - 576 с.
13. ВНИИГМИ-МЦД // URL: http:ZZmeteo.ru/data
14. Ramya S. Diagnosis of Chronic Kidney Disease Using Machine Learning Algorithms Z S. Ramya, N. Radha ZZ International Journal of Innovative Research in Computer and Communication Engineering. - 2016. - Vol. 4, No. 1. - P. 812-820.