Тема: Использование Data Mining при решении задач гидрометеорологического прогнозирования
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Актуальность работы 4
Цель работы 5
Задачи работы 5
Исходные данные 7
1 Использование DataMining для решения гидрометеорологических задач 8
1.1 Определение DataMining 8
1.2 Деревья решений 9
1.3 Характеристика построения деревьев классификации 11
1.3.1 Иерархическая природа деревьев классификации 11
1.3.2 Гибкость метода деревьев классификации 11
1.4 Критерий расщепления 13
1.5 Построение деревьев классификации 15
1.6 Стратегии построения деревьев классификации оптимальных
размеров 17
1.7 Остановка построения
дерева 18
1.8 Алгоритмы ветвления деревьев решений. Особенности алгоритма
CART 19
1.9 Преимущества деревьев
классификации 21
2 Модель межгодовых колебаний уровня моря в Кронштадте на основе
алгоритма деревьев решений 24
2.1 Построение деревьев классификации 24
2.2 Расчёт множественной линейной регрессии 32
2.3 Стандартные ошибки. Сравнение результатов расчёта уровня моря в Кронштадте по методу деревьев классификации и по методу множественной линейной регрессии с фактическим уровнем моря 39
3 Модель межгодовых колебаний стока Печоры на основе алгоритма
деревьев решений 50
3.1 Построение деревьев классификаций. Расчёт множественной
линейной регрессии 50
3.2 Стандартные ошибки 53
Заключение 56
Список литературы 58
Приложение 1 61
Приложение 2 71
Приложение 3 81
Приложение 4 82
Приложение 5 83
Приложение 6 84
Приложение 7 85
Приложение 8 87
📖 Введение
В данной выпускной квалификационной работе рассматривается использование DataMining для решения гидрометеорологического прогнозирования. Из разнообразных методов, которые составляют различные методы прогнозирования, моделирования и классификации, чья основа базируется на использовании искусственных нейронных сетей, эволюционного программирования, нечёткой логики, деревьев решений, ассоциативной памяти, было решено проверить возможности технологии прогноза дерева решений, а точнее, деревьев классификации.
Для определения эффективности и точности метода деревьев классификации проведено сравнение с классическим методом регрессионного анализа, таким как множественная линейная регрессия.
Методы DataMining широко применяются в различных сферах деятельности, таких как прикладная экономика, социология, при разработке искусственного интеллекта и в прочих областях. В данных областях методы DataMining зарекомендовали себя как эффективные, а полученные результаты достаточно легко интерпретируются.
Актуальность рассматриваемого метода заключается в том, что в настоящее время крайне редко применяется для гидрометеорологических прогнозов. Метод деревьев классификаций является перспективным благодаря простоте реализации и наглядности представляемой информации.
Цель работы
Целью выпускной квалификационной работы является проверка возможности применения метода Data Mining для решения гидрометеорологических задач...
✅ Заключение
гидрометеорологических характеристик, по которым рассчитывался уровень, либо различной длины временной ряд. Также, для сравнения, были рассчитана МЛР по тем же характеристикам, что и деревья классификации.
В процессе выполнения были выявлены недостатки в применении деревьев классификации к гидрометеорологическим задачам. Во-первых, сложность и нетривиальность выбора оптимального размера дерева классификации. Во-вторых, значительное увеличение размеров дерева с ростом временного ряда — при возросшем меньше чем в два раза временном ряду, дерево увеличилось более чем в два раза. В-третьих, стандартная ошибка по независимой выборке практически всегда больше чем по зависимой, что означает, возможные сильные ошибки в прогнозе.
В сравнении метода МЛР и деревьев классификации, модели, рассчитанные по последнему методу, проигрывают в точности прогноза. Однако, нельзя не отметить, что и с помощью метода дерева классификации можно получить модель, которая будет достаточно хорошо прогнозировать гидрометеорологическую характеристику. При том что ветвление в дереве классификации происходит чисто формально, без учёта физических взаимосвязей. Также отсутствие какой-либо важнойсоставляющей для прогнозаисходной характеристики не сказывается сильно отрицательно на моделях деревьев классификации.
Увеличение числа переменных, используемых для прогноза, не усложняет структуру дерева классификации, в отличие от МЛР. Следовательно, оптимальную модель можно быстрее и проще выбрать, и рассчитать по ней прогноз.
Таким образом, использование метода дерева классификации для решения различных гидрометеорологических задач представляется перспективным направлением. Однако следует найти такие гидрометеорологические задачи, для решения которых наиболее оптимально будет использования деревья классификации и которые сложно и/или не всегда эффективно решать классическими физико-статистическими методами. Также для наиболее рационального использования метода дерева решений необходимо решить проблему с выбором оптимального размера дерева.





