РЕФЕРАТ 3
ВВЕДЕНИЕ 4
1 МЕТОД ДЕРЕВЬЕВ РЕШЕНИЙ КАК ИНСТРУМЕНТ ДЛЯ АНАЛИЗА ДАННЫХ И
ПРОГНОЗИРОВАНИЯ 6
1.1 АНАЛИЗ ДАННЫХ DATA MINING И ОСОБЕННОСТИ ЕГО ПРИМЕНЕНИЯ ДЛЯ
РЕШЕНИЯ ПРИКЛАДНЫХ ЗАДАЧ 6
1.2 МЕТОДЫ DATA MINING ПРИ РЕШЕНИИ ЗАДАЧ КЛАССИФИКАЦИИ И
ПРОГНОЗИРОВАНИЯ 7
1.3 МЕТОД ДЕРЕВЬЕВ РЕШЕНИЙ. ОБУЧАЮЩАЯ ВЫБОРКА 14
2 ПОСТРОЕНИЕ ДЕРЕВА РЕШЕНИЙ CHAID В
ПРИЛОЖЕНИИ IBM SPSS STATISTICS ДЛЯ РЕШЕНИЯ ЗАДАЧИ ПРОГНОЗИРОВАНИЯ УСПЕШНОСТИ ОБУЧЕНИЯ СТУДЕНТОВ ВУЗА 16
2.1 АЛГОРИТМ CHAID ПОСТРОЕНИЯ ДЕРЕВА РЕШЕНИЙ. КРИТЕРИЙ ХИ- КВАДРАТ 16
2.2 ПОСТРОЕНИЕ ДЕРЕВА РЕШЕНИЙ И ЕГО НАСТРОЙКА В
IBM SPSS STATISTICS 19
2.3 РЕАЛИЗАЦИЯ ПРОГНОЗА НА ОСНОВЕ КЛАССИФИЦИРУЮЩИХ ПРАВИЛ... 23
3 ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМА CART ПОСТРОЕНИЯ ДЕРЕВА РЕШЕНИЙ НА ЯЗЫКЕ PYTHON ДЛЯ РЕШЕНИЯ ЗАДАЧИ ПРОГНОЗИРОВАНИЯ
УСПЕШНОСТИ ОБУЧЕНИЯ СТУДЕНТОВ ВУЗА 26
3.1 АЛГОРИТМ CART ПОСТРОЕНИЯ ДЕРЕВА РЕШЕНИЙ. ИНДЕКС GINI 26
3.2 РЕАЛИЗАЦИЯ И НАСТРОЙКА ДЕРЕВА РЕШЕНИЙ ПОСРЕДСТВОМ
БИБЛИОТЕК PYTHON 28
3.3 СРАВНЕНИЕ РЕЗУЛЬТАТОВ РАБОТЫ РЕАЛИЗОВАННЫХ АЛГОРИТМОВ ДЛЯ
РЕШЕНИЯ ЗАДАЧИ ПРОГНОЗИРОВАНИЯ УСПЕШНОСТИ ОБУЧЕНИЯ 33
ЗАКЛЮЧЕНИЕ 34
СПИСОК ИСТОЧНИКОВ 35
ПРИЛОЖЕНИЯ 37
Ускоренный информационный рост во всех сферах деятельности общества порождает лавинообразно увеличивающийся поток информации, не позволяющий современному человеку качественно воспринять необходимые данные, обработать, понять, сохранить и создать новые знания. В условиях существующей ситуации демографического и информационного кризиса, для того, чтобы человек нашел свое место в сфере материального и социокультурного производства, особая нагрузка должна быть перенесена на сферу образования. Современные проблемы повышения качества, подготовки выпускников учреждения высшего образования (бакалавров, специалистов, магистров) все больше приобретают значимый характер. Это объясняет актуальность и востребованность исследования в данном направлении.
В настоящее время вопросам управления качеством образования, построению систем менеджмента качества, уделяется значительное внимание на разных уровнях управления: федеральном, ведомственном, отдельного вуза[1].
Основным критерием успешности обучения считается академическая успеваемость, выражающаяся в балльной оценке учебных достижений. Прогнозирование успеваемости на ранних стадиях обучения, еще при поступлении в вуз, дает возможность повысить эффективность управления студенческим контингентом.
В данной работе рассматривается возможность применения метода деревьев классификации для анализа и прогнозирования успеваемости студента в зависимости от его индивидуальных характеристик.
Цель - разработать приложение для оценки эффективности работы приемной кампании вуза на основе метода деревьев решений.
Задачи:
• На основе выборки построить дерево решений CHAID в приложении IBM SPSS Statistics
• Осуществить программную реализацию алгоритма построения дерева на языке Python
• Осуществить настройку построенных моделей, сгенерировать классифицирующие правила.
Метод дерева решений является эффективным инструментом обработки данных, что было подтверждено использованием этого метода в прогнозировании успеваемости учащихся. Чтобы предсказать успех обучения, вы можете использовать методы, которые были продемонстрированы в этой работе.
В результате исследования были выявлены определенные факторы и их совокупности, которые оказывают наиболее существенное влияние на процесс формирования успеваемости студента.
Алгоритм поиска значимых факторов метода дерева решений значительно сократил количество входных анализируемых параметров, что важно в процессе принятия решений.
Применение результатов, полученных в ходе приема абитуриентов, позволяет нам выявить факторы, которые необходимо учитывать при подаче заявления на обучение в университете.
Результаты исследования могут быть использованы для анализа допущенного контингента студентов в работе приемных комиссий вузов, а также для оценки потребностей профессорско-преподавательского состава в работе учебных заведений.
1. Кузьминова, А.В. Исследование скрытых закономерностей при прогнозирования успешности освоения учебных программ в техническом университете [Текст] :Сб. науч. трудов научной сессии НИЯУ МИФИ/ А.В. Кузьминова. - М.: МИФИ, 2011. - 42 с..
2. Чубукова, И.А. Data Mining [Текст]: учебное пособие/ И.А.Чубукова. - М.: Интернет-университет информационных технологий, Бином. Лаборатория знаний,2014. - 346 с.
3. Барсегян, А.А. Методы и модели анализа данных: OLAP и Data Mining [Текст]/ А.А. Барсегян. - М.: БХВ-Петербург, 2004. -320 с.
3. Ташкинов, А.А. Применение метода деревьев классификации к прогнозированию уровня развития моторики у больных с нарушениями двигательных функции [Текст]:научная статья / А.А. Ташкинов. - М.:Российский журнал биомеханики,2008. - с.84-95.
4. IBM SPSS Statistics. Статистические методы анализа данных
[Электронный ресурс] - URL: https://www.specialist.ru/course/spss1 (дата
обращения 18.05.2019)
5. Реброва, О.Ю. Применение методов интеллектуального анализа данных для решения задачи медицинской диагностики [Текст] / О.Ю Реброва // Новости искусственного интеллекта. - 2004. - № 3. -c. 76-80.
6. Куприянов, А.С. Методы и модели анализа данных: OLAP и Data Mining [Текст]/ А.С. Куприянов - М.: БХВ-Петербург, 2008. - 219 с.
7. Дюк, В.А. Data Mining [Текст]: учебный курс / В.А. Дюк, А.П. Самойленко. - СПб.: Питер, 2001. - 203 с.
8. Суфиянов, В.Г. Разработка адаптивных статистических моделей классификации и прогнозирования [Текст]/ В.Г. Суфиянов. - Пермь.: Мир,
2004. -301 с.
9. Афифи, А.М. Статистический анализ: подход с использованием ЭВМ [Текст] / А. Афифи, С. Эйзен. - М.: Мир, 1982. -320 с.
10. Вильдеман, А.В. Применение метода деревьев классификации к прогнозированию уровня развития моторики у больных с нарушениями двигательных функции [Текст]:научная статья / В.А. Бронников, А.В. Вильдеман. - М.:Российский журнал биомеханики,2008. - с. 84-95.
11. Breiman, L. Classification and regression trees. [Текст]/ Breiman, L., Friedman J. H., Olshen R. A., & Stone C. J. - CA: Wadsworth & Brooks/Cole Advanced Books & Software, 1984 -102 c.
12. Как реализовать алгоритм дерева решений с нуля в Python [Электронный ресурс] - URL: https://www.machinelearningmastery.ru/implement-decision-tree- algorithm-scratch-python/ (дата обращения 18.05.2019)
13. Толстова Ю.Н. Анализ социологических данных. [Текст]/ Ю.Н. Толстова - М.: Научный мир, 2000 -131 c.
14. Грудцына, Л.Ю. Прогнозирование длительности безработицы на основе деревьев решений. [Текст] / Л.Ю.Грудцына, И.Ю. Мышкина// Вестник КГТУ им. А.Н.Туполева. - 2015. - №5(81) - с. 143-147.
15. Паклин, Н.Б., Бизнес-аналитика: от данных к знаниям. [Текст] : учебное пособие/ В.И. Орешков, Н.Б. Паклин - СПб.: Питер, 2013. — С. 459-465.
16. Dan Nelson Overview of Classification Methods in Python with Scikit-Learn [Электронный ресурс]/ Nelson Dan - URL: https://stackabuse.com/overview-of- classification-methods-in-python-with-scikit-learn/ (дата обращения 20.06.2019)