Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА ИНСТРУМЕНТА НАСТРАИВАЕМОЙ ГЕНЕРАЦИИ РАСПРЕДЕЛЕНИЙ ОБУЧАЮЩИХСЯ

Работа №41071

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы63
Год сдачи2019
Стоимость6500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
391
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1. АНАЛИЗ СУЩЕСТВУЮЩИХ АНАЛОГОВ 6
1.1 Ручное распределение 6
1.2 Автоматическое распределение по группам 7
2. ВХОДНЫЕ ДАННЫЕ 9
2.1 Общее описание системы 9
2.2 Данные о студентах 9
2.2.1 Обработка типовых параметров 12
2.2.2 Обработка текстовых параметров 12
3. РАСПРЕДЕЛЕНИЕ ПО ГРУППАМ 16
3.1 Входные данные распределения 16
3.2 Метод распределения «схожие объекты вместе» 17
3.2.1 Выбор метода распределения по группам 17
3.2.2 Кластеризация данных 18
3.2.3 Алгоритм кластеризации для задачи распределения по группам 19
3.2.4 Формирование групп на основе матрицы принадлежности 23
3.3 Метод распределения «различные объекты вместе» 25
3.3.1 Метод имитации отжига 25
3.3.2 Параметры метода имитации отжига 27
3.3.3 Реализация метода имитации отжига 28
4. ИНСТРУМЕНТ ДЛЯ ВЫПОЛНЕНИЯ РАСПРЕДЕЛЕНИЯ 30
4.1 Программная реализация 30
4.2 База данных 33
4.3 Тестирование инструмента 34
4.3.1 Описание входных данных 34
4.3.2 Результаты распределения методом «схожие объекты вместе» 35
4.3.3 Результаты распределения методом «различные объекты вместе» 38
ЗАКЛЮЧЕНИЕ 41
СПИСОК ЛИТЕРАТУРЫ 43
ГЛОССАРИЙ 48
Приложение А. Модель данных 49
Приложение Б. Загрузка данных о студентах 51
Приложение В. Распределение студентов методом кластеризации 53
Приложение Г. Распределение методом имитации отжига 58
Приложение Д. Вычисление метрик

На сегодняшний день набирает популярность идея индивидуализации образования [1], при реализации которой объектом его планирования становится каждый отдельный обучающийся. Считается, что при таком подходе к обучению создаются наилучшие условия для подготовки специалиста. Однако добиться индивидуального подхода на практике в условиях массового образования достаточно сложно [2], поскольку трудно учитывать разницу в уровне знаний обучающихся, их индивидуальные различия и многое другое. Следовательно, принимать во внимание особенности одного студента без ущерба для другого в рамках единой образовательной среды достаточно сложно.
Одним из методов внедрения элементов индивидуального подхода в обучении является работа в малых группах или проектных командах [3]. При этом нужно очень тщательно подходить к вопросу распределения обучающихся по группам и учитывать большой набор критериев: успеваемость студента, профильная лаборатория/кафедра/группа, достижения и др. Стоит также отметить, что перечень данных о студентах, который можно учитывать при распределении по группам, постоянно увеличивается и изменяется.
Вопросом генерации групп занимаются сотрудники деканата, а с уже сформированными группами взаимодействует профессорско-преподавательский состав.
В большинстве случаев задача разбиения обучающихся на группы решается вручную. Однако ручная обработка больших данных может привести к ошибкам и неточностям, связанным с человеческим фактором. Помимо этого, при ручном распределении учитывается небольшой набор критериев, и большая часть информации о студентах не принимается во внимание.
Ввиду негативных факторов ручного распределения, а также большого числа разнородных слабоструктурированных данных о студентах в рамках настоящей дипломной работы была поставлена цель - создать гибкий инструмент генерации распределений обучающихся, который мог бы подстраиваться под произвольные входные данные и критерии разбиения.
Для инструмента автоматического распределения обучающихся по группам не важна цель данного разбиения, а необходимы лишь входные данные и правила, на основании которых необходимо сформировать группы. Это позволяет создать гибкую систему, которую можно использовать для задач распределения по академическим группам, составления проектных команд, разбиения для занятий по физической культуре и др.
Для достижения поставленной цели было выделено несколько задач:
1. Проанализировать предметную область и существующие аналоги;
2. Разработать методы классификации входных данных, а также изучить приемы их обработки;
3. Определить методы деления на группы и алгоритмы их генерации;
4. Выбрать меру схожести входных данных о студентах;
5. Определить средства разработки;
6. Спроектировать, разработать и протестировать инструмент.
Объектом исследования в данной работе являются распределения обучающихся. Предмет исследования - способы генерации распределений обучающихся при различных критериях деления на группы и произвольных входных данных.
Новизна работы заключается в возможности инструмента подстраиваться под разные задачи распределения вместо использования фиксированных правил разбиения без возможности их настройки в процессе работы. Характеристики студента, на основе которых происходит формирование групп, могут изменяться и расширяться.
Практическая значимость данной работы заключается в том, что созданный инструмент можно использовать в различных задачах генерации групп. Это позволит понизить сложность и сократить время выполнения данной работы.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В ходе данной работы были изучены существующие инструменты генерации распределения обучающихся, а также типы данных, используемые в разбиении.
Была произведена классификация входных данных о студенте, разработан алгоритм распознавания, обработки и хранения разных характеристик студента.
Были определены методы распределения студентов по группам, для которых были выбраны и разработаны алгоритмы генерации разбиения.
Был спроектирован и разработан web-инструмент, при помощи которого можно загружать, обрабатывать и выполнять распределения обучающихся по группам. Разработанный инструмент был апробирован в рамках практических задач по генерации распределений по академическим группам студентов первого курса Высшей школы информационных технологий и интеллектуальных систем КФУ.
Таким образом, все поставленные задачи были выполнены. Дальнейшее развитие работы можно видеть в расширении списка методов распределения по группам, добавления расширенной настройки параметров разбиения, а также выгрузки полученных групп из системы.
Настоящая работа была представлена на конференциях:
• Итоговая научно-образовательная конференция студентов КФУ, 2018 год;
• XI Международная научно-практическая конференция «Электронная Казань 2019».
Результаты работы были опубликованы в статьях [8, 46]:
• Коргутлова, Н. А., Басаргина, С. Ю., Абрамский, М. М., Солнцев, М. А., Бузукина, Т. С. Формирование академических групп и проектных команд на основе сбора данных об обучающихся //Электронные библиотеки. - 2018. - Т. 21. - №. 3-4. - С. 193-208.
• Басаргина, С. Ю., Абрамский, М. М. Инструменты настраиваемой генерации распределений обучающихся // Ученые записи Института социальных и гуманитарных знаний - 2019. - №1(17) - С. 565-571.



1. Cheng, Y.C. New Paradigm for Re-engineering Education: Globalization, Localization and Individualization //Education in the Asia-Pacific Region: Issues, Concerns and Prospects. - V. 6. - New York: Springer-Verlag New York, Inc., 2005. - 508 p.
2. Петрунева Р. М. Индивидуально-ориентированная организация учебного процесса: иллюзии и реальность //Высшее образование в России. - 2011. - №. 5. - C. 65-70.
3. Имакаев В. Р. и др. Новые подходы к организации и обеспечению самостоятельной работы студентов //Материалы Всероссийской науч. - метод. конф. - 2011. - С. 1557-1565.
4. Дыбов А. С., Юдина Н. М., Кондрашов А. А. Определение уровня здоровья студентов по «Г руппам здоровья» и распределение для занятий физической культурой или спортом //Международный студенческий научный вестник. - 2015. - №. 5-4. - С. 509-510.
5. Виноградов И. Г., Токарева А. В. Динамика распределения студентов первого курса по учебным группам для занятий физической культурой на основании медицинских показаний //Современные научные исследования и инновации. - 2015. - №. 9-2. - С. 112-113.
6. Подвесовский А. Г., Лагерев Д. Г., Егорова И. Г. Автоматизация распределения студентов по руководителям выпускных квалификационных работ с применением модели двустороннего матчинга //Современные информационные технологии и ИТ-образование. - 2017. - Т. 13. - №. 4. - С. 147-157.
7. Пронин А. С., Веретенник Е. В., Семенов А. В. Формирование учебных групп в университете с помощью анализа социальных сетей //Вопросы образования. - 2014. - №. 3. - С. 54-73.
8. Коргутлова Н. А. и др. Формирование академических групп и проектных команд на основе сбора данных об обучающихся //Электронные библиотеки. - 2018. - Т. 21. - №. 3-4. - С. 193-208.
9. Ермаков А. Е. Извлечение знаний из текста и их обработка: состояние и перспективы //Информационные технологии. - 2009. - №. 7. - С. 50-55.
10. Большакова Е. И. и др. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. - М.: МИЭМ - 2015 - 269 с.
11. Гращенко Л. А. О модельном стоп-словаре // Известия Академии наук Республики Таджикистан. Отделение физико-математических, химических, геологических и технических наук — 2013. — № 1(150). — С. 40-46.
12.Silva C., Ribeiro B. The importance of stop word removal on recall values in text categorization //Proceedings of the International Joint Conference on Neural Networks, 2003. - IEEE, 2003. - Т. 3. - С. 1661-1666.
13. Филипчик А. В. Стемминг слов в лингвистической информационнопоисковой системе //Апробация. - 2016. - №. 1 (40). - С. 65-66.
14. Lovins J. B. Development of a stemming algorithm //Mech. Translat. & Comp. Linguistics. - 1968. - Т. 11. - №. 1-2. - С. 22-31.
15. Усков И. В. Лемматизация русских текстов компьютером //Автоматизация, мехатроника, информационные технологии. - 2013. - С. 182-185.
16. Plisson J. et al. A rule based approach to word lemmatization //Proceedings of IS-2004. - 2004. - С. 83-86.
17. Korenius T. et al. Stemming and lemmatization in the clustering of finnish text documents //Proceedings of the thirteenth ACM international conference on Information and knowledge management. - ACM, 2004. - С. 625-633.
18. Разваляев П.С., Гуляева М.Г., Ивженко С.П. Выбор метода нормализации текстов //Проблемы управления в социально-экономических и технических системах - 2016. - С. 102-104.
19. Balakrishnan V., Lloyd-Yemoh E. Stemming and lemmatization: a comparison of retrieval performances //Proceedings of SCEI Seoul Conferences, 10-11 Apr 2014, Seoul, Korea. - 2014. - C. 174-179.
20. Михайлов Д. В., Козлов А. П., Емельянов Г. М. Выделение знаний и языковых форм их выражения на множестве тематических текстов: подход на основе меры TF-IDF //Компьютерная оптика. - 2015. - Т. 39. - №. 3. - C. 429-438.
21.Sparck Jones K. A statistical interpretation of term specificity and its application in retrieval //Journal of documentation. - 1972. - Т. 28. - №. 1. - С. 11-21.
22.Черезов Д. С., Тюкачев Н. А. Обзор основных методов классификации и кластеризации данных //Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии.
- 2009. - №. 2. - С. 25-29.
23. Тюрин А. Г., Зуев И. О. Кластерный анализ, методы и алгоритмы кластеризации //Вестник МГТУ МИРЭА. - 2014. - Т. 2. - №. 3. - С. 86
97.
24. Суркова А. С., Буденков С. С. Построение модели и алгоритма кластеризации в интеллектуальном анализе данных //Вестник Нижегородского университета им. НИ Лобачевского. - 2012. - №. 2-1 - С. 198-202.
25. Баранов М.А. Классификация алгоритмов кластеризации //Научные труды (Вестник МАТИ). - 2014. - №23(95). - С. 149-156.
26. Нейский И. М. Классификация и сравнение методов кластеризации //Интеллектуальные технологии и системы. Сб. учебно-методических работ и статей аспирантов и студентов. М.: НОК «CLAIM. - 2006. - №. 8.
- С. 130-142.
27. Bezdek J. C., Ehrlich R., Full W. FCM: The fuzzy c-means clustering algorithm //Computers & Geosciences. - 1984. - Т. 10. - №. 2-3. - С. 191203.
28. Ершов К. С., Романова Т. Н. Анализ и классификация алгоритмов кластеризации //Новые информационные технологии в автоматизированных системах. - 2016. - №. 19 - C. 274-279.
29. Тараскина А. С. Нечеткая кластеризация по модифицированному методу С-средних и ее применение для обработки микрочиповых данных //Проблемы интеллектуализации и качества систем автоматизации. - 2013. - Т. 13. - С. 217-228.
30. Миниахметов Р. М., Цымблер М. Л. Интеграция алгоритма кластеризации Fuzzy c-Means в PostgreSQL //вычислительные методы и программирование. - 2012. - Т. 13. - №. 2. - С. 46-52.
31. Жиглявский А.А., Жилинкас А.Г. Методы поиска глобального экстремума. - М.: Наука. - 1991. - 248 с.
32. Скаков Е. С. Алгоритм имитации отжига для решения оптимизационных задач //Ответственный редактор: Сукиасян АА, к. э. н., ст. преп. - 2015. - С. 56-60.
33. Ипатов А. В. Модифицированный метод имитации отжига в задаче маршрутизации транспорта //Труды института математики и механики УРО РАН. - 2011. - Т. 17. - №. 4. - С. 121-125.
34. Глушань В. М. Метод имитации отжига //Известия Южного федерального университета. Технические науки. - 2003. - Т. 31. - №. 2. - С. 148-150.
35.Ingber L. Simulated annealing: Practice versus theory //Mathematical and computer modelling. - 1993. - Т. 18. - №. 11. - С. 29-57.
36.Van Laarhoven P. J. M., Aarts E. H. L. Simulated annealing //Simulated annealing: Theory and applications. - Springer, Dordrecht, 1987. - С. 7-15.
37.Ingber L., Rosen B. Genetic algorithms and very fast simulated reannealing: A comparison//Mathematical and Computer Modelling. - 1992. - Т. 16. - №. 11. - С. 87-100.
38.Савин А. Н., Тимофеева Н. Е. Применение алгоритма оптимизации методом имитации отжига на системах параллельных и распределённых вычислений //Известия Саратовского университета. Новая серия. Серия
Математика. Механика. Информатика. - 2012. - Т. 12. - №. 1. - С. 110— 116.
39. Сивоголовко Е. В. Методы оценки качества чёткой кластеризации //Компьютерные инструменты в образовании. - 2011. - №. 4. - C. 14-31.
40. Python - официальный сайт [Электронный ресурс]. - Режим доступа: https://www.python.org/ - (Дата обращения: 12.06.19).
41. Документация Django 1.9 [Электронный ресурс]. - Режим доступа: https://djbook.ru/rel1.9/ - (Дата обращения: 12.06.19).
42. Bootstrap [Электронный ресурс]. - Режим доступа: http://getbootstrap.ru/ - (Дата обращения: 12.06.19).
43. jQuery [Электронный ресурс]. - Режим доступа: http://jquery.com/ - (Дата обращения: 12.06.19).
44. NLTK 3.4.3 documentation [Электронный ресурс]. - Режим доступа: https://www.nltk.org/ - (Дата обращения: 12.06.19).
45. Pymystem3 [Электронный ресурс]. - Режим доступа: https://github.com/nlpub/pymystem3 - (Дата обращения: 12.06.19).
46. Басаргина, С. Ю., Абрамский, М. М. Инструменты настраиваемой генерации распределений обучающихся // Ученые записи Института социальных и гуманитарных знаний - 2019. - №1(17) - С. 565-571.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ