Тема: РАЗРАБОТКА ЕСТЕСТВЕННО-ЯЗЫКОВОЙ СИСТЕМЫ КОНТРОЛЯ ЗНАНИЙ
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1.1. Постановка задачи и её актуальность 2
1.2. Существующие подходы к решению задачи 3
2. Архитектура системы 11
3. Программный модуль «Редактор онтологии» 14
3.1. Погружение онтологии в реляционную базу данных 14
3.2. Предметные области баз знаний 18
3.3. Интерфейс редактора 19
4. Программный модуль «Генератор вопросов» 24
4.1. Схема шаблонов вопросов и процесс генерации 24
4.2. Классификация вопросов 27
4.3. Интерфейс генератора 28
5. Программный модуль «Конструктор тестов» 31
5.1. Варианты структуры теста 31
5.2. Вычисление общей сложности теста 32
5.3. Интерфейс конструктора 33
6. Программный модуль «Экзаменатор» 37
6.1. Модуль сбора статистики о тестируемом 37
6.2. Алгоритм адаптации теста 37
6.3. Модуль естественно-языкового анализа ответов 41
6.4. Интерфейс экзаменатора 43
7. Заключение 46
8. Список литературы
📖 Введение
Область компьютерной обработки информации можно также охарактеризовать развитием науки о данных (data science), позволяющей производить статистическое исследование больших объемов информации и получать аналитические выводы. Интеграция такой обработки информации в систему электронного образования позволяет более полно оценивать уровень знаний обучающихся и адаптировать образовательный курс к этому уровню.
Существует множество вариантов реализации системы электронного образования в виде веб-приложений и веб-сайтов: онлайн курсы, включающие мультимедиа материалы, видео лекций, дистанционные семинары (вебинары). Одним из важнейших преимуществ таких систем является доступ с любого устройства, где есть дисплей и подключение к интернету. Преимущества данных систем давно взяты на вооружение крупными компаниями, заинтересованными в повышении квалификации своих сотрудников. Конкретными примерами этих систем могут служить такие ресурсы как Microsoft Virtual Academy, Khan Academy, Global Online Academy, Open University, Coursera, Udemy, Udacity.
✅ Заключение
Исходя из результатов экспериментов над генерацией вопросов можно сделать вывод, что также необходимо более тщательно проработать структуру базы данных для поддержки большего числа шаблонов и типов вопросов. Общее направление дальнейшей модификации базы данных — обеспечение обратной, совместимости для ставших классическими онтологических схем предметной области.
Некоторый анализатор естественного языка можно также внедрить в «Редактор онтологии» как вспомогательный визуальный инструмент, позволяющий сразу выделить из текста необходимые для словаря элементы и, возможно, отношения между ними. Это существенно облегчит работу эксперта по заполнению базы знаний.
Также стоит отметить, что хотя многие вопросы были содержательными, то есть правильными семантически, были ошибки в морфологии субъектов вопроса, поскольку морфология зависит от преобразующего метода. Для решения этой проблемы необходимо интегрировать в систему возможность использования существующих словарей и языковых корпусов для получения наиболее правильного морфологического представления слов в вопросах.
Алгоритм адаптации работает достаточно быстро, однако скорость работы зависит от сложности структуры теста. Поэтому можно предусмотреть метод настройки алгоритма, который бы вычислял необходимую начальную конфигурацию, а для улучшения результатов алгоритм можно запускать в нескольких потоках, либо итеративно совершать несколько применений алгоритма к тесту до достижения необходимого результата.
Структура данных теста представлена всегда в виде дерева, которое удобно для реализации алгоритмов над тестом, но содержит увеличивающие длительность обхода по дереву дублирующиеся данные в случае, когда из нескольких узлов ребра сходятся в эквивалентные ветви дерева. Это стандартный случай теста, в котором после некоторых вопросов происходит развилка, далее соединяющаяся в общий линейный поток вопросов. Поэтому можно дублировать дерево теста в виде эквивалентного графа, уменьшив таким образом затраты по производительности за счет несущественного увеличения затрат по памяти.
Исходя из намеченных подзадач можно сделать вывод об основном направления для дальнейшего исследования и разработки. Оно включает наполнение базы шаблонов как для генератора вопросов, так и для анализатора ответов, модификация анализатора вместе с возможной реструктуризации базы знаний предметной области по необходимости. Для этого необходимо провести тестирование работы системы в реальных рабочих условиях. Потому планируется создание электронного образовательного ресурса для преподавателей, в который можно будет заносить курсы по учебному плану и использовать систему со студентами, таким образом получая прямые отзывы пользователей и рекомендации по улучшению системы.



