Введение 3
Постановка задачи 5
Обзор литературы 6
Глава 1. Численная модель конвективного облака 7
1.1. Проблемы и способы наблюдения атмосферных процессов 7
1.2. Классификация облаков в атмосфере 8
1.3. Этапы развития конвективного облака 10
1.4. Методы построения прогнозов 11
1.5. Классификация численных моделей 11
Глава 2. Технология OLAP и многомерные базы данных 14
2.1. Описание технологии OLAP 14
2.2. Основы многомерного представления данных 16
2.3. Структура многомерного куба 17
Глава 3. Описание OLAP-системы Jedox Palo 19
3.1. Структура системы Jedox Palo 19
3.2. Возможности Jedox Palo 20
Глава 4. Определение машинного обучения 21
Глава 5. Машинное обучение в метеорологии 22
5.1. The Weather Research and Forecasting Model 22
5.2. AmazonMachineLearning 24
5.3. Технология прогнозирования погоды «Метеум» 24
Глава 6. Выбор данных для исследования 27
Глава 7. Алгоритм k ближайших соседей 29
3.1. Описание алгоритма k ближайших соседей 29
3.2. Применение алгоритма k ближайших соседей 30
Выводы 33
Заключение 34
Список литературы
Решение проблемы прогнозирования опасных конвективных явлений является одной из наиболее важных и актуальных задач современной науки. Ежедневно люди различных профессий по всему миру узнают прогноз погоды при помощи телевизора, радио, газет, сети Интернет. То, что деятельность человечества во многом зависит от погодных явлений, не поддается сомнению. Тропические циклоны, ураганы, смерчи, снегопад, наводнения причиняют громадный экономический ущерб, а также угрожают человеческим жизням. Гроза, град, шквал, обильные осадки неблагоприятно сказываются на целых отраслях, таких как: сельское хозяйство, авиация, грузоперевозки, строительные работы, отопительные системы и др.
Возникновение опасных атмосферных явлений зависит от процессов, происходящих в конвективных облаках. Изучение облаков проводится в следующих направлениях: лабораторные исследования, натурные эксперименты и численное моделирование. Наиболее эффективным методом является численное моделирование, которое позволяет проводить исследования без использования труднодоступного и дорогостоящего оборудования.
В соответствии с размерностью пространства выделяют одномерные, полуторамерные, двухмерные и трехмерные модели конвективных облаков. Наиболее полно облака описывают двух- и трехмерные модели, но они требуют больших вычислительных ресурсов и использования суперкомпьютеров. Для расчетов на обычном персональном компьютере более подходящей является полуторамерная модель облака, так как она способна воспроизводить характеристики, которые достаточно полно описывают модель для обработки данных практически в режиме реального времени: значение высоты верхней и нижней границ, максимальные значения водности, перегрева, скорости восходящего потока и др.
В данной работе проводится прогноз опасных конвективных явлений на основании загруженных в многомерную базу данных значений численных параметров смоделированного облака с применением методов машинного обучения. В многомерной базе данных численные параметры облака организованы в виде упорядоченных многомерных массивов, что значительно упрощает обращение к каждому конкретному параметру в сравнении с использованием реляционной базы данных. Реляционная модель данных по большей части предназначена для выполнения транзакций, многомерная модель – для интерактивного анализа больших массивов данных. Машинное обучение – подраздел теории искусственного интеллекта, изучающий методы построения алгоритмов, способных получать знания из имеющихся данных. В машинном обучении применяются различные элементы математической статистики, теории вероятностей, методов оптимизации, а также рассматриваются проблемы вычислительной эффективности и переобучения. В данной работе с помощью методов машинного обучения решается задача автоматической классификации результатов радиозондирования атмосферы, что может быть использовано для осуществления прогноза опасных конвективных явлений на метеорологических станциях и в метеоцентрах.
Все поставленные цели были достигнуты.
Был осуществлен выбор наиболее подходящей для поставленных задач численной модели облака.
Была получена обучающая выборка данных радиозондирования атмосферы с помощью комплексной информационной системы, которая позволила отобрать 676 вертикальных профилей температуры и влажности, 196 из которых наблюдались в отсутствии опасных конвективных явлений, а 480 – при наличии грозы, дождя, ливня.
Реализован прогноз опасного конвективного явления по результатам работы численной модели. При прогнозировании наличия явления и определения грозы относительно дождя и ливня удалось достигнуть точности предсказания свыше 96 %.