Тип работы:
Предмет:
Язык работы:


Анализ и реализация алгоритмов построения дерева решений

Работа №120450

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы61
Год сдачи2022
Стоимость4385 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
10
Не подходит работа?

Узнай цену на написание


Введение 7
1 История возникновения и анализ дерева решений 9
1.1 История возникновения метода 9
1.2 Анализ дерева решений 12
1.3 Выразительность деревьев решений 19
2 Методы и алгоритмы решения задач с помощью дерева решений 23
2.1 Деревья решений: общие принципы 23
2.2 Алгоритм CART 32
2.3 Алгоритм ID3 35
2.4 Алгоритм C4.5 36
3 Реализация и тестирование алгоритмов построения дерева решений 39
Заключение 45
Список используемой литературы 46
Приложение А Программный код

В выпускной квалификационной работе рассматривается процесс анализа и реализации алгоритмов построения дерева решений.
Актуальность работы заключается в том, что методы деревьев решений популярны в аналитике данных и машинном обучении с практическим применением в различных секторах, от здравоохранения до финансов и технологий. Деревья принятия решений проще, чем нейронные сети, в связи с тем, что их правила формируются на естественном языке. Эти правила генерируются за счет обобщения множества отдельных наблюдений, которые служат обучающими примерами и описывают предметную область. Поэтому их называют индуктивными правилами, а сам процесс обучения — индукцией деревьев решений.
Объектом выпускной квалификационной работы являются задачи оптимизации, решаемые на основе метода дерева решений.
Предметом выпускной квалификационной работы являются следующие алгоритмы генерации дерева решений:
- алгоритм ID3,
- алгоритм C4.5,
- алгоритм CART.
Целью работы является анализ и реализация алгоритма ID3, алгоритма C4.5 и алгоритма CART.
Для достижения поставленных целей необходимо решить следующие задачи:
- проанализировать алгоритмы построения дерева решений для исследования их эффективности,
- выбрать технологии для проектирования алгоритмов построения дерева решений,
- исследовать математические модели алгоритмов построения дерева решений,
- реализовать алгоритмы построения дерева решений,
- протестировать реализованные алгоритмы построения дерева решений,
- проанализировать эффективность алгоритмов построения дерева решений.
Результатом работы является реализация алгоритма ID3, алгоритма C4.5 и алгоритма CART, а также анализ их эффективности.
В первой главе рассматривается история возникновения метода «дерева решений», а также задачи, решаемые с помощью данного метода.
Во второй главе рассматриваются методы и алгоритмы решения задач с помощью дерева решений.
В третьей главе рассматриваются современные архитектурные решения; реализуются и тестируются алгоритмы построения дерева решений с использованием выбранной ранее технологии.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения дипломной работы на тему «Анализ и реализация алгоритмов построения дерева решений» был рассмотрен процесс осуществления алгоритмов построения дерева решений и их последующий анализ.
Цель работы заключалась в анализе и реализации алгоритма ID3, алгоритма C4.5, а также алгоритма CART.
Для достижения поставленной цели проанализированы основные принципы дерева решений, включающие в себя подробное изложение этапов построения.
С помощью существующих математических моделей реализованы алгоритм ID3, алгоритм C4.5, а также алгоритм CART для построения дерева решений. Алгоритмы разработаны на функциональном языке программирования Python в интегрированной свободной среде для создания приложений PyCharm.
Для работы с реализованными алгоритмами и анализа их эффективности использовалась операционная система Windows.
Как показал анализ трёх реализованных алгоритмов построения дерева решений - каждый из рассмотренных алгоритмов походит для определенных типов задач.
Так алгоритм ID3 подходит для наборов данных с категориальными признаками. Алгоритм С4.5 подходит как для наборов данных с категориальными признаками, так и для наборов данных с числовыми признаками. А алгоритм CART в свою очередь подходит как для работы с категориальными, так и с числовыми признаками, но может строить только бинарные деревья.



1. Адельсон-Вельский Г. М., Ландис Е. М. Один алгоритм организации информации // Доклады АН СССР. - 1962. - Т. 146, №
2. - С. 263-266. URL:
http: //www.mathnet.ru/links/20762a931307aefO2c107c3 d8f6244b8/dan26964.pdf
2. Алгоритмы. Построение и анализ. Томас Кормен [и др.] - М.: «Вильямс», 2019. - 1328 с.
3. Бабенко М. А., Левин М. В. Введение в теорию алгоритмов и структур данных. — М.: МЦНМО. 2020. 144 с.
4. Вирт Н. Алгоритмы и структуры данных. - ДМК Пресс, 2011. - 272 с.
5. Вороновский Г. К., Махотило К. В., Петрашев С. Н., Сергеев С. А. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. Х.: ОСНОВА, 1997. 112 c.
6. Гашев С. Н. Математические методы в биологии: анализ биологических данных в системе Statistica. — М.: Юрайт. 2020. 208 с.
7. Галушкин А. И. Нейрокомпьютеры. Учебное пособие. М.: Альянс, 2014. 528 c.
8. К. Шеннон. Работы по теории информации и кибернетике. М. Иностранная литература, 1963.
9. Кнут Д. Искусство программирования. Том 3. Сортировка и поиск. - Диалектика-Вильямс, 2019. - 832 с.
10. Кравченко А. И. Анализ и обработка социологических данных. Учебник. — М.: КноРус. 2020. 498 с.
11. Левитин А. В. Алгоритмы. Введение в разработку и анализ. - М.: Вильямс, 2006. - 576 с.
12. Латыпова Р. Нейронные сети. М.: LAP Lambert Academic Publishing,
2012. 465 c.
13. Лутц М. Программирование на Python. Том 2. М.: Символ-плюс,
2013. 334 c.
14. Осовский. С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2004. 343 с.
15. Форсье Д. Django. Разработка веб-приложений на Python. М.: Символ-плюс, 1979. 326 c.
16. Breiman, Leo, J. Friedman, R. Olshen, and C. Stone. Classification and Regression Trees. Wadsworth, Belmont, CA, 1984.
17. Bruce Reed. The height of a random binary search tree, 2003. URL: https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.152.1289&re p=rep1&t ype=pdf
18. Daniel Sleator, Robert Tarjan. Self-Adjusting Binary Search Trees, 1985. URL: http://www.cs.cmu.edu/~sleator/papers/self-adjusting.pdf
19. Hovland, C. I. (1960). Computer simulation of thinking. American Psychologist, 15(11), 687-693.
20. Hunt, Earl B.; Janet Marin; Philip J. Stone (1966). Experiments in Induction. New York: Academic Press. ISBN 978-0-12-362350-8.
21. J. Ross Quinlan. C4.5: Programs for Machine learning. Morgan Kaufmann Publishers 1993.
22. Martinez Conrado, Roura Salvador. Randomized binary search trees, URL:https://www.researchgate.net/publication/220432012_Randomized _Binary_Search
23. Python 3.10.4 documentation. [Электронный ресурс] URL: https:ZZdocs.python.org/3Z(дата обращения 10.05.2022).
24. Quinlan, J. R. (1986). Induction of decision trees. Machine Learning, 1(1):81-106.
25. Quinlan, J. Ross. C4.5: Programs for Machine learning. Morgan Kaufmann Publishers 1993.
26. Robert Tarjan. Data Structures and Networks Algorithms, 1987. URL: https://doc.lagout.
org/Others/Data%20Structures/Data%20Structures%20and%20 Network%20Algorithms%20%5BTarjan%201987-01 -01 %5D.pdf
27. Sabharwal N., Agrawal A. Hands-on Question Answering Systems with BERT: Applications in Neural Networks and Natural Language Processing. New York City: Apress, 2021. 184 с.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ