Тема: Разработка приложения для формирования тестовых заданий по грамматике английского языка на основе нейросетевых технологий
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Генерация текста с помощью RNN 8
1.2. Генерация текста с помощью CNN 15
1.3. Генерация текста с помощью Transformer 16
2. НАБОР ДАННЫХ 20
2.1. Описание набора данных 20
2.2. Предобработка данных 21
2.3. Расширение набора данных 27
3. ПОСТРОЕНИЕ НЕЙРОСЕТЕВОЙ МОДЕЛИ 30
3.1. Эксперименты на наборе данных Tatoeba 30
3.2. Эксперименты на расширенном наборе данных 33
4. РАЗРАБОТКА ПРИЛОЖЕНИЯ 38
4.1. Проектирование 38
4.2. Реализация 40
4.3. Тестирование 46
4.4. Создание контейнера Docker 47
ЗАКЛЮЧЕНИЕ 49
ЛИТЕРАТУРА 50
📖 Введение
В связи с временным переходом множества учреждений на дистанционную форму работы стала очевидной актуальность развития форм образования с использованием интернета и информационных технологий. Получение образования в такой форме, помимо возможности продолжения получения образования в экстремальных ситуациях, предоставляет учащемуся множество других преимуществ [1].
Перевод обучения в дистанционную форму также связан с определенными затруднениями в таких областях как связь с учащимися и обеспечение корректности проведения различных видов тестирования. В частности, использование ограниченного набора тестовых вопросов может со-провождаться утечкой ответов. Такая ситуация может поставить учащихся в неравное положение при решении различных тестовых задач.
Некоторые задачи, например такие, решение которых связано с математическими расчетами, могут быть размножены в неограниченном количестве с помощью замены входных данных и автоматического расчета ответа. Однако другие задачи, к примеру, связанные с изучением языков, требуют значительно больших усилий для создания. В связи с этим актуальной является задача автоматической генерации подобных задач.
Одним из эффективных инструментов генерации последовательностей, в том числе осмысленного текста, являются нейронные сети. Различные задачи, связанные с генерацией текста, к примеру, создание обзоров в социальных сетях, были решены с помощью нейронных сетей [2]. В данной работе было решено рассмотреть различные подходы к генерации текста с помощью нейронных сетей, выбрать из них наиболее подходящий для задачи генерации коротких тестовых предложений, а также реализовать прототип приложения для генерации тестовых заданий на тему английского языка.
Постановка задачи
Целью выпускной квалификационной работы является разработка приложения для формирования тестовых заданий на тему грамматики английского языка на основе нейросетевых технологий. Для выполнения поставленной цели необходимо решить следующие задачи.
1. Провести анализ различных способов генерации текста с помощью нейросетевых технологий.
2. Подготовить набор данных для обучения нейросетевой модели, осуществляющей автоматическую генерацию предложений на английском языке.
3. Реализовать генеративную нейросетевую модель на основе выбранной в ходе анализа технологии и выполнить ее обучение на подготовленном наборе данных.
4. Выполнить проектирование и реализацию приложения для формирования тестовых заданий.
5. Провести тестирование приложения и проверку его переносимости на другие персональные компьютеры.
Структура и объем работы
Работа состоит из введения, четырех глав, заключения и списка литературы. Объем работы составляет 52 страницы, объем списка литературы – 35 источников.
В первой главе рассматриваются различные нейросетевые технологии, использующиеся для задачи генерации текста. Выполнен сравнительный анализ видов нейронных сетей по нескольким критериям, важным для рассматриваемой задачи. В результате анализа по выбранным критериям один из рассмотренных видов нейронных сетей был выбран для дальнейшей работы.
Во второй главе описывается использованный для обучения модели набор данных и источники предложений, вошедших в этот набор. Приведено описание операций по предобработке данных, включающих в себя 6
подготовку материалов для обучения классификатора, выделяющего часть набора данных по критерию грамматического времени использованного в предложении глагола, проведенные для выделения более подходящей для поставленной задачи части набора, а также расширение набора данных за счет дополнительных источников. Представлена подготовка файлов, непосредственно используемых для обучения модели.
В третьей главе содержатся эксперименты по изменению структуры и масштаба генеративной модели, а также набора данных, используемого для ее обучения. Приведены примеры предложений, генерируемых нейронными сетями различных структур, обученных на различных наборах данных. Определено влияние различных параметров на конечный результат генерации.
В четвертой главе описывается разработка приложения для генерации тестовых заданий. Представлено проектирование, в ходе которого были рассмотрены функциональные и нефункциональные требования к системе, а также составлены диаграмма вариантов использования системы и диаграмма деятельности для одного из вариантов использования. Показана реализация спроектированного приложения на основе составленных требований, а также приведены результаты тестирования его основных функций, подтверждающие корректность его работы. Описано развертывание приложения в контейнере, демонстрирующее его переносимость на другие персональные компьютеры.
✅ Заключение
После подготовки набора данных были проведены эксперименты с различными структурами генеративной нейронной сети, обученными на различных подмножествах подготовленного набора данных. В ходе экспериментов было продемонстрировано влияние набора данных на результаты генерации, а также определена приблизительная скорость работы модели при запуске без использования графического ускорителя.
После проведения экспериментов было выполнено проектирование графического приложения, которое может использоваться для составления тестовых заданий с помощью обученной генеративной модели. В ходе реализации были созданы функции для генерации предложения и тестового вопроса, а также построено приложение с графическим интерфейсом, после чего выполнено его тестирование. В завершение приложение было развернуто в контейнере на платформе Docker для демонстрации его переносимости на другие персональные компьютеры.



