🔍 Поиск готовых работ

🔍 Поиск работ

Разработка алгоритма кластеризации климатических данных

Работа №202481

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы84
Год сдачи2022
Стоимость4915 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
11
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 13
1. АНАЛИТИЧЕСКИЙ ОБЗОР 14
1.1 Задача кластеризации 14
Цели кластеризации 14
1.2 Графовые методы кластеризации 14
1.3 Алгоритм FOREL 15
1.4 Статистические алгоритмы 16
1.5 Иерархическая кластеризация 16
1.6 Обучение без учителя 16
1.7 Сеть Кохонена 18
1.8 Соревновательное обучение 18
2. Алгоритм кластеризации климатических данных 20
2.1 Описание алгоритма 20
2.2 Разработка способа кластеризации с внедрением метрики среднегодовых температур 21
3. МАТЕРИАЛЫ И МЕТОДЫ 22
3.1 NumPy 22
3.2 Pandas 22
3.3 Matplotlib 22
3.4 K-Средних 22
3.5 Нейронная сеть Кохонена 23
Используемые наборы данных 23
4 РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ 23
4.1 Кластеризация на основе k - средних 23
4.2 Кластеризация на основе нейросетевого алгоритма Кохонена 30
Среднемесячная температура 30
Среднегодовая температура 31
Средняя температура за 62 года 33
5. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение 35
5.1 Предпроектный анализ 35
5.1.1 Потенциальные потребители результатов исследования 35
5.1.2 Анализ конкурентных решений 36
5.1.3 SWOT-анализ 36
5.1.4 Оценка готовности проекта к коммерциализации 37
5.2. Инициация проекта 39
5.3 Планирование управления научно-техническим проектом 39
5.3.1 План проекта 39
5.3.2 Бюджет научного исследования 40
5.2.7 Накладные расходы 43
5.3 Оценка сравнительной эффективности исследования 43
6. СОЦИАЛЬНАЯ ОТВЕТСТВЕННОСТЬ 46
6.1 Правовые аспекты обеспечения безопасности 47
6.2 Эргономические требования к рабочему месту 47
6.3 Производственная безопасность 48
6.3.1 Вредные производственные факторы 49
6.3.2 Опасные производственные факторы 55
6.4 Экологическая безопасность 56
6.5 Безопасность в чрезвычайных ситуациях 57
Выводы по разделу 59
Заключение 60
ПРИЛОЖЕНИЕ A

Одной из самых существенных и масштабных проблем современности на текущий момент можно назвать непрерывно растущий объем информации, который требует определенной систематизации, упрощения и вычленения ее существенной части. С развитием технических средств и интернет- технологий объем цифровых данных растет в огромных масштабах и исчисляется терабайтами. Осуществлять обработку таких данных вручную трудоемко, а существующие методы могут оказаться неэффективными. Поэтому для решения задач такого рода требуются все более и более новые методы обработки данных. Современные методы должны с достаточно высокой точностью осуществлять анализ, систематизацию и сбор полученной информации.
Методы, позволяющие анализировать большие объемы данных, имеют широкий спектр применения. Так, в медицине по совокупности кластерных симптомов можно с достаточно высокой точностью установить диагноз и назначить последующее лечение; в экономике набор параметров кластера может использоваться для выделения групп потребителей, их поведения и их потребительской корзины; в метеорологии кластерный анализ позволяет выделять климатические зоны и прогнозировать их изменение. С помощью алгоритмов кластеризации можно реализовать задачу распознавания образов, а также существует достаточно высокая потребность в обработке больших объемов данных в научных исследованиях. На основании вышеизложенного можно сделать вывод, что востребованность алгоритмов кластеризации и их исследования достаточно высока.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Целью данной выпускной квалификационной работы является разработка метода и исследование алгоритма кластеризации климатических данных.
Для этого были решены следующие задачи:
- Проведен анализ существующих и актуальных на данный момент методов кластеризации. Выявлены их преимущества и недостатки;
- Было предложено использовать среднегодовое значение температур для кластеризации временных рядов;
- На основании выявленных закономерностей была подтверждена гипотеза о пригодности среднегодового и среднего значения температуры в целом (за 62 года) как метрики для кластеризации временных рядов;
- При анализе данных температурных рядов были выявлены паттерны поведения рядов, отличающихся синхронностью и как правило незначительной разницей в значениях температуры, были выявлены узловые точки, демонстрирующие сходство между климатом станций;
- С применением подготовленных данных была осуществлена кластеризация методом k-средних, взятым в качестве эталонного и выделены климатические классы;
- Реализован нейросетевой алгоритм кластеризации, опирающийся в своей архитектуре на сеть Кохонена;
- С помощью реализованного алгоритма был проведен эксперимент. Была проведена кластеризация климатических данных при установке различных параметров. Были получены уникальные климатические классы;
- Были выявлены различия результатов кластеризации с методом k- средних, взятым в качестве эталонного алгоритма;
- В отличие от k-средних у нейросетевого алгоритма в зависимости от выбранной метрики результаты могут быть различными, что говорит о чувствительности алгоритма к входным данным;



1. Воронцов К.В. Алгоритмы кластеризации и многомерного шкалирования. Курс лекций. МГУ, 2007. - Режим доступа:
http://www.ccas.ru/voron/download/Clustering.pdf - дата доступа: 19.05.2022.
2. Обучение без учителя. [Электронный ресурс] Режим доступа: https://wiki.loginom.ru/articles/unsupervised-learning.html - Дата доступа19.02.2022
3. Сеть Кохонена (Kohonen Network). [Электронный ресурс] Режим доступа: https://wiki.loginom.ru/articles/kohonen-network.html - Дата доступа: 20.02.2022
4. Нейронные сети Кохонена. [Электронный ресурс] Режим доступа: https://neuronus.com/theory/nn/955-nejronnye-seti-kokhonena.html - Дата доступа: 20.02.2022
5. Конкурентное обучение (Competitive Learning). [Электронный ресурс] Режим доступа:https://wiki.loginom.ru/articles/competitive-learning.html - Дата доступа: 20.02.2022
6. NumPy [Электронный ресурс] Режим доступа:
https://ru.wikipedia.org/wiki/NumPy- Дата доступа 12.05.2022
7. Pandas [Электронный ресурс] Режим доступа: https://ru.wikipedia.org/wiki/Pandas - Дата доступа 12.05.2022
8. Matplotlib [Электронный ресурс] Режим доступа: https://ru.wikipedia.org/wiki/Matplotlib - Дата доступа 12.05.2022
9. Метод k-средних (K-Means) [Электронный ресурс] Режим доступа: https://www.helenkapatsa.ru/mietod-k-sriednikh/- Дата доступа 14.05.2022
10. Карта Кохонена [Электронный ресурс] Режим доступа: https://basegroup.ru/deductor/function/algorithm/kohonen - Дата доступа 14.05.2022
11. Трудовой кодекс Российской Федерации от 30.12.2001 N 197-ФЗ
12. СанПиН 1.2.3685-21 "Гигиенические нормативы и требования к обеспечению безопасности и (или) безвредности для человека факторов среды обитания"
13. ГОСТ 22269-76 «Рабочее место оператора. Взаимное расположение элементов рабочего места»
14. ГОСТ Р 50923-96 «Рабочее место оператора. Общие эргономические требования и требования к производственной среде. Методы измерения.
Дисплеи»
15. ГОСТ 12.2.032-78 «Рабочее место при выполнении работ сидя»
16. СП. 51.13330.2011 «Свод правил защита от шума»
17. СП 52.13330.2016 «Свод правил естественное и искусственное
освещение»
18. СНиП 23-05-95 «Строительные нормы и правила российской федерации естественное и искусственное освещение»
19. ГОСТ 12.1.006-84 ССБТ «Электромагнитные поля радиочастот допустимые уровни на рабочих местах и требования к проведению контроля»
20. ГОСТ 12.1.038-82 Система стандартов безопасности труда (ССБТ).
Электробезопасность. Предельно допустимые значения
напряжений прикосновения и токов.
21. ГОСТ Р 12.1.019-2017 ССБТ «Система стандартов безопасности труда. Электробезопасность. Общие требования и номенклатура видов защиты»
22. ГОСТ 17.4.3.04-85 «Общие требования к контролю и охране от загрязнения»
23. ГОСТ Р 53692-2009. «Ресурсосбережение. обращение с отходами. этапы технологического цикла отходов»
24. ГОСТ 12.1.004-91. «Система стандартов безопасности труда. пожарная безопасность»


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ