ВВЕДЕНИЕ 3
ГЛОССАРИЙ 5
ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1 Определение цифрового портрета 8
1.2 Определение источника сбора данных 8
1.2.1 Сообщества для сбора информации о пользователях 10
1.3 Описание модели собираемых данных 12
1.4 Данные, получаемые на основе анализа собранной модели 16
1.5 Группы обрабатываемых данных 17
1.6 Способы обработки данных 18
1.7 Анализ существующих решений 21
1.7.1 Технологии решающие схожие проблемы 21
1.7.2 Другие работы в данной предметной области 23
ГЛАВА 2. РАЗРАБОТКА СИСТЕМЫ 24
2.1 Проектирование системы 24
2.1.1 Описание разрабатываемой системы 24
2.1.2 Архитектура системы 25
2.2 Особенности разработки системы 32
2.2.1 Используемые технологии 32
2.2.2 Процесс реализации, последовательность выполнения задач 35
2.2.3 Основные проблемы и трудности реализации 36
ГЛАВА 3. ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ 40
3.1 Разработанная система 40
3.2 Статистика по собранным данным 41
ГЛАВА 4. ПРИМЕНЕНИЯ СИСТЕМЫ 44
4.1 Самостоятельная система в рамках университета 44
ЗАКЛЮЧЕНИЕ 45
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 47
ПРИЛОЖЕНИЯ
Из этого факта следует проблема, заключающаяся в недостатке данных об абитуриентах, необходимых для индивидуализации высшего образования, особенно - на начальных этапах обучения. Данная информация необходима для получения представления о наклонностях и интересах абитуриента. Нехватка такого рода информации имеет место ввиду того, что при подаче документов на поступление в ВУЗы, абитуриенту не требуется подавать подробную информацию о себе. Также, не разработан инструмент, который позволил бы эффективно собрать и обработать информацию из уже имеющихся открытых источников данных, а также представить эту информацию в наглядном виде с целью по-строения эффективной модели индивидуализации образования.
Целью данной работы является разработка способа для получения учебными заведениями информации об абитуриентах, что в результате позволило бы повысить эффективность индивидуализации образования на начальных этапах обучения студентов в ВУЗах.
В качестве предполагаемого решения данной проблемы, была выдвинута гипотеза о том, что если осуществить разработку и внедрить инструмент, позволяющий проводить сбор и анализ данных об абитуриентах из открытых источников информации, то получится создать информационную базу, на основе которой можно будет делать выводы об индивидуальных наклонностях абитуриентов и эффективно разрабатывать, и строить систему реализующую подход к образованию, как к индивидуализированному процессу.
Актуальность данной проблемы обусловлена тем, что в настоящее время среди многих образовательных учреждений прослеживается тренд к индивидуализации образования [2], но нет инструмента, позволяющего эффективно реализовать такие подходы к образованию.
Новизна данного исследования состоит в том, что несмотря на высокую распространенность технологий по сбору и анализу данных и схожие принципы работы (например, методы для создания контекстной рекламы), эти технологии пока не используются для сферы образования, а именно, пока не разработана система, позволяющая собирать информацию из открытых источников и анализировать ее с целью определения интересов и склонностей абитуриентов как ВУЗов, так и прочих образовательных учреждений. Существуют системы, реализующий схожий функционал, но они находятся в собственности крупных компаний и поисковых систем, и используются для других целей, не связанных с образованием. [3]
В ходе работы, для достижения цели исследования потребуется решить следующие задачи:
1. Провести обзор существующих решений
2. Анализ существующих технологий, позволяющих решить проблему
3. Изучение источников информации, предоставляющих данные о целевой группе (абитуриентах)
4. Изучение документации к API социальных сетей
5. Выделение основных методов и способов для получения информации
6. Определение компетенций и характеристических данных, которые могут быть получены при анализе информации
7. Разработка архитектуры системы по сбору и анализу данных
8. Реализация системы
9. Сбор тренировочных данных, то есть таких данных, в которых известны как данные, которые могли бы быть собраны из открытых источников информации, так и данных которые должны быть получены на вы¬ходе из системы, как результат анализа
10. Проверка корректности работы системы и адекватности результата при использовании на реальных данных
В ходе выполнения данной работы был произведен обзор литературы и поиск существующих решений по предметной области, в ходе которого было выяснено, что на данный момент не разработано решение отвечающее всем по-ставленным в работе требованиям и решающим описанную проблему нехватки данных об абитуриентах в полной мере. Для решения данной проблемы, были поставлены задачи, решение которых было достигнуто в ходе данной работы.
Был определен источник открытой информации, в наибольшей степени подходящий для получения данных об абитуриентах. Кроме того, данный источник предоставляет подходящий инструментарий для удобства реализации системы сбора информации.
В качестве средства для анализа данных было использовано несколько подходов, такие как: агрегация и сопоставление различных полей собранных данных с целью выявления новых характеристик абитуриента, а также алгоритмы текстовой аналитики для определения интересов абитуриента.
Для проверки системы были использованы данные с 5 реальных сообществ «ВКонтакте», которые были сохранены и обработаны. Данный факт подтверждает пригодность системы к дальнейшему использованию и подтверждает успешность выполнения поставленных задач и достижения поставленной цели исследования - разработки системы, позволяющей учебным заведениям собирать информацию об абитуриентах, с целью повышения качества индивидуализации образования.
В дальнейшем, работа разработанной системы может быть улучшена за счет внедрения более совершенных алгоритмов текстовой аналитики, позволяющих получать более точные данные об интересах абитуриентов на основании содержимого записей на их страницах, а также доработана новыми модулями, позволяющими проводить аналитику данных по направлениям, требующимися учебным заведениям в конкретных ситуациях.
1. Постановление правительства РФ от 28.08.2001 № 630
2. Evrim Baran. A Review of Research on Mobile Learning in Teacher Education. Journal of Educational Technology & Society. Том. 17, No. 4, Review Articles in Educational Technology (Октябрь 2014), С. 17-32
3. Geoffrey I. Webb, Michael J. Pazzani, Daniel Billsus. Machine Learning for User Modeling. User Modeling and User-Adapted Interaction. Март 2001, Том 11, Статья 1-2, С. 19-29.
4. Кондурар Марина Викторовна Понятия компетенция и компетентность в образовании // Вектор науки Тольяттинского государственного университета. Серия: Педагогика, психология. 2012. №1. URL:
https://cyberleninka.ru/article/n/ponyatiya-kompetentsiya-i-kompetentnost-v- obrazovanii(дата обращения: 20.03.2018).
5. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика М.: Мир, 1992. — 240 с.
6. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. — М.: Финансы и статистика, 1983.
7. Murai K. et al. Basic evaluation of performance of bridge resource teams involved in on-board smart education: lookout pattern. - 2006. - Т. 3. - С. 77-83.
8. Дюк Вячеслав Анатольевич, Флегонтов Александр Владимирович, Фомина
Инга Константиновна Применение технологий интеллектуального анализа данных в естественнонаучных, технических и гуманитарных областях // Известия РГПУ им. А.И. Герцена. 2011. №138. URL:
https://cyberleninka.ru/article/n/primenenie-tehnologiy-intellektualnogo-analiza- dannyh-v-estestvennonauchnyh-tehnicheskih-i-gumanitarnyh-oblastyah(дата обращения: 15.06.2018).
9. ^равочник технического переводчика. - Интент. 2009-2013.
10. Статья 152-ФЗ, федеральном законе от 27.07.2006 № 149-ФЗ, ч. 4 ст. 29 Конституции
11. Пучков Н. П., Щербакова А. В. Развитие творческих качеств специалиста в
процессе изучения курса математики в вузе // Вестник Тамбовского университета. Серия: Естественные и технические науки. 2003. №3. URL:
https:ZZcyberleninka.ru/articleZn/razvitie-tvorcheskih-kachestv-spetsialista-v- protsesse-izucheniya-kursa-matematiki-v-vuze(дата обращения: 25.05.2018).
12. Ефимова Ирина Николаевна Социологический анализ рынка образовательных услуг с целью выявления мотивации абитуриентов 2011 года при выборе вуза // Вестник ННГУ. 2012. №4-1. URL:
https:ZZcyberleninka.ru/articleZn/sotsiologicheskiy-analiz-rynka-obrazovatelnyh- uslug-s-tselyu-vyyavleniya-motivatsii-abiturientov-2011-goda-pri-vybore-vuza (дата обращения: 10.06.2018).
13. Орлова Елена Александровна. Московский государственный областной университет. Влияние профессиональной деформации личности преподавателя средней школы на развитие конфликтности у подростков. 2013 г.
14. Григорий Пятецкий-Шапиро. Data Mining и перегрузка информацией // Вступительная статья к книге: Анализ данных и процессов / А. А. Барсегян, М. С. Куприянов, И. И. Холод, М. Д. Тесс, С. И. Елизаров. З-е изд. перераб. и доп. СПб.: БХВ-Петербург, 2009. 512 с. С. 13.
15. A. Feshchenko, V. Goiko, G. Mozhaeva, K. Shilyaev, A. Stepanenko Analysis of user profiles in social networks to search for promising entrants ZZ INTED2017 Proceedings, 11th International Technology, Education and Development Confer-ence, March 6th-8th, 2017 - Valencia, Spain. - P. 5188 - 5194.
16. Hackeling G. Mastering Machine Learning with scikit-learn. - Packt Publishing Ltd, 2014.
17. Bergstra J. et al. Theano: A CPU and GPU math compiler in Python ZZProc. 9th Python in Science Conf. - 2010. - Т. 1.
18. Коршунов Антон, Белобородов Иван, Бузун Назар, Аванесов Валерий, Пастухов Роман, и др. Анализ социальных сетей: методы и приложения // Труды ИСП РАН. 2014. №1.
19. Пронин Александр Сергеевич, Веретенник Елена Вадимовна, Семенов
Александр Владимирович. Формирование учебных групп в университете с помощью анализа социальных сетей // Вопросы образования. 2014. №3. URL: https://cyberleninka.ru/article/n/formirovanie-uchebnyh-grupp-v-
universitete-s-pomoschyu-analiza-sotsialnyh-setey (дата обращения:
30.05.2018).