Введение 3
Обзор литературы 5
Глава 1. Постановка задачи 7
1.1. Описание предметной области 7
1.1. Описание математической модели 12
Глава 2. Анализ временных рядов 16
2.1. Первичная обработка и анализ данных 16
2.2. Исследование временных рядов в R 22
Глава 3. Реализация метода SSA в R 35
3.1. Обзор функций и библиотек 37
3.2. Обсуждение полученных результатов 38
Глава 4. Реализация метода SSA в Python 45
4.1. Обзор функций 45
4.2. Обсуждение полученных результатов 46
5. Заключение 53
6. Список использованной литературы 55
7. Приложение № 1 59
8. Приложение № 2 68
Последние несколько лет стали самыми теплыми за весь период метеорологических наблюдений, на данный момент температуры превышает по разным данным на 1-1,5 градуса Цельсия температурные значения доиндустриальной эпохи. Таяние ледников и сокращение ледникового покрова происходит значительно быстрее, чем когда-либо прежде, что приводит к повышению уровня мирового океана. А это значит, что множество городов мира, расположенных в районах, подверженных риску затопления могут уйти под воду уже в нашем веке. В связи с этим возникает потребность не только в более глубоком изучении процесса, но и в прогнозировании дальнейшего его поведения.
Целью данной работы является вероятностно-статистический анализ и прогнозирование глобального потепления с помощью метода Singular Spectrum analysis (SSA).
Для достижения поставленной цели решены следующие задачи:
1. Изучение предметной области и построение информационно-
логической модели для процесса глобального потепления;
2. Сбор и систематизация метеорологических показателей для анализа климатических условий выбранных регионов;
3. Проведение корреляционно-регрессионного анализа для выбранных параметров;
4. Изучение соответствующей литературы и способов программной реализации для метода (SSA);
5. Программная реализация метода SSA с помощью среды разработки Rstudio и языка программирования Python;
6. Сравнение прогнозных значений, полученных в ходе реализации в разных средах разработки с реальными данными;
7. Анализ полученных результатов и оценка адекватности модели
Данная исследовательская работа имеет следующую структуру. В 1 главе сформулирована постановка задачи, в которую входят описание предметной области и построение соответствующей информационно-логической модели, а также математическая модель. В главе номер 2 представлены результаты первичного вероятностно-статистического анализа и построенные ARIMA модели. Главы 3 и 4 включают в себя программную реализацию метода Singular spectrum analysis в среде Rstudio и Python, с описанием полученных результатов. Также итогом 2, 3 и 4 глав стал сравнительный анализ,
критериями которого выступали преимущества и недостатки методов, а также способов реализации и точность прогнозных значений. В заключении формулируются основные выводы и полученные результаты с возможными направлениями для дальнейших исследований.
В ходе работы было проведено исследование предметной области процесса глобального потепления, которое включало в себя изучение причин, последствий и соответствующих мер борьбы и поддержки, оказываемых для сдерживания темпов глобального потепления.
Проведен первичный вероятностно-статистический анализ по итогам которого сформулированы следующие выводы:
1. На гистограммах среднемесячных температур наблюдаются разные темпы повышения температурных значений в разные времена года. В исследуемых населенных пунктах наибольшее повышение температур наблюдалось в различных месяцах;
2. Подсчитаны показатели динамики для каждого временного ряда:
• самая высокая средняя температура за рассматриваемый промежуток времени в Котласе (1,825°С), а самая низкая в городе Верхоянске (-14,734ОС);
• только в 3 из 7 оставшихся исследуемых населенных пунктов наблюдается положительный средний темп прироста, причем максимальный в Котласе - 0,702%. В 4 оставшихся наблюдается отрицательный прирост, что говорит о ежегодном понижении температур. Максимальное понижение наблюдается в Салехарде и составляет -1,782%.
На основе первичного вероятностно-статистического анализа можно сделать вывод о потеплении, но не глобальном, а скорее локальном, так как в нескольких из исследуемых городов наблюдается понижение средних температур.
С помощью языка программирования R и инструментов среды разработки Rstudio были проведены исследования временных рядов на стационарность, выполнена их декомпозиция и построена соответствующая модель ARIMA учитывающая тренд и сезонную компоненты. Для каждой модели были проведены оценки адекватности, включающие в себя тесты на нормальное распределение остатков и их автокорреляцию. После были получены прогнозные значения на 2021 и 2022 год, а также подсчитаны показатели качества модели и точность прогнозных значений.
Помимо простых методов анализа временных рядов был реализован один из универсальных и более точных методов - метод SSA. Для его использования были выбраны две среды разработки: Python и Rstudio. И в той и в другой среде удалось отобрать наиболее информативные компоненты временного ряда, выполнить его декомпозицию, построить корреляционную матрицу и получить прогноз на 2021, 2022 и 2023 года. Определить точность прогнозных значений удалось только для 2021 и 2022 годов, так как для них уже присутствуют фактические значения. Практически для всех моделей качество прогноза составило 80 и более процентов.
Перед применением различных методов анализа временных рядов были проведены тесты на стационарность, которые не выявили изменение средних значений во времени, что говорит об отсутствии тренда. Данное замечание также подтверждает результаты полученные при первичном вероятностно - статистическом анализе.
Говоря о направлениях для дальнейших исследований хочется провести анализ климатических показателей экваториальной зоны, так как именно в ней наблюдаются высокие значения температур в сочетании с повышенной влажностью воздуха. Также интересным представляется представить метеорологические величины как зависимые от расположения города: близость к морю, рельеф местности, уровень солнечной радиации и т.д.