📄Работа №215110

Тема: Разработка приложения для формирования тестовых заданий по грамматике английского языка на основе нейросетевых технологий

📝
Тип работы Дипломные работы, ВКР
📚
Предмет информатика
📄
Объем: 52 листов
📅
Год: 2022
👁️
Просмотров: 3
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

ВВЕДЕНИЕ 5
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Генерация текста с помощью RNN 8
1.2. Генерация текста с помощью CNN 15
1.3. Генерация текста с помощью Transformer 16
2. НАБОР ДАННЫХ 20
2.1. Описание набора данных 20
2.2. Предобработка данных 21
2.3. Расширение набора данных 27
3. ПОСТРОЕНИЕ НЕЙРОСЕТЕВОЙ МОДЕЛИ 30
3.1. Эксперименты на наборе данных Tatoeba 30
3.2. Эксперименты на расширенном наборе данных 33
4. РАЗРАБОТКА ПРИЛОЖЕНИЯ 38
4.1. Проектирование 38
4.2. Реализация 40
4.3. Тестирование 46
4.4. Создание контейнера Docker 47
ЗАКЛЮЧЕНИЕ 49
ЛИТЕРАТУРА 50

📖 Введение

Актуальность
В связи с временным переходом множества учреждений на дистанционную форму работы стала очевидной актуальность развития форм образования с использованием интернета и информационных технологий. Получение образования в такой форме, помимо возможности продолжения получения образования в экстремальных ситуациях, предоставляет учащемуся множество других преимуществ [1].
Перевод обучения в дистанционную форму также связан с определенными затруднениями в таких областях как связь с учащимися и обеспечение корректности проведения различных видов тестирования. В частности, использование ограниченного набора тестовых вопросов может со-провождаться утечкой ответов. Такая ситуация может поставить учащихся в неравное положение при решении различных тестовых задач.
Некоторые задачи, например такие, решение которых связано с математическими расчетами, могут быть размножены в неограниченном количестве с помощью замены входных данных и автоматического расчета ответа. Однако другие задачи, к примеру, связанные с изучением языков, требуют значительно больших усилий для создания. В связи с этим актуальной является задача автоматической генерации подобных задач.
Одним из эффективных инструментов генерации последовательностей, в том числе осмысленного текста, являются нейронные сети. Различные задачи, связанные с генерацией текста, к примеру, создание обзоров в социальных сетях, были решены с помощью нейронных сетей [2]. В данной работе было решено рассмотреть различные подходы к генерации текста с помощью нейронных сетей, выбрать из них наиболее подходящий для задачи генерации коротких тестовых предложений, а также реализовать прототип приложения для генерации тестовых заданий на тему английского языка.
Постановка задачи
Целью выпускной квалификационной работы является разработка приложения для формирования тестовых заданий на тему грамматики английского языка на основе нейросетевых технологий. Для выполнения поставленной цели необходимо решить следующие задачи.
1. Провести анализ различных способов генерации текста с помощью нейросетевых технологий.
2. Подготовить набор данных для обучения нейросетевой модели, осуществляющей автоматическую генерацию предложений на английском языке.
3. Реализовать генеративную нейросетевую модель на основе выбранной в ходе анализа технологии и выполнить ее обучение на подготовленном наборе данных.
4. Выполнить проектирование и реализацию приложения для формирования тестовых заданий.
5. Провести тестирование приложения и проверку его переносимости на другие персональные компьютеры.
Структура и объем работы
Работа состоит из введения, четырех глав, заключения и списка литературы. Объем работы составляет 52 страницы, объем списка литературы – 35 источников.
В первой главе рассматриваются различные нейросетевые технологии, использующиеся для задачи генерации текста. Выполнен сравнительный анализ видов нейронных сетей по нескольким критериям, важным для рассматриваемой задачи. В результате анализа по выбранным критериям один из рассмотренных видов нейронных сетей был выбран для дальнейшей работы.
Во второй главе описывается использованный для обучения модели набор данных и источники предложений, вошедших в этот набор. Приведено описание операций по предобработке данных, включающих в себя 6
подготовку материалов для обучения классификатора, выделяющего часть набора данных по критерию грамматического времени использованного в предложении глагола, проведенные для выделения более подходящей для поставленной задачи части набора, а также расширение набора данных за счет дополнительных источников. Представлена подготовка файлов, непосредственно используемых для обучения модели.
В третьей главе содержатся эксперименты по изменению структуры и масштаба генеративной модели, а также набора данных, используемого для ее обучения. Приведены примеры предложений, генерируемых нейронными сетями различных структур, обученных на различных наборах данных. Определено влияние различных параметров на конечный результат генерации.
В четвертой главе описывается разработка приложения для генерации тестовых заданий. Представлено проектирование, в ходе которого были рассмотрены функциональные и нефункциональные требования к системе, а также составлены диаграмма вариантов использования системы и диаграмма деятельности для одного из вариантов использования. Показана реализация спроектированного приложения на основе составленных требований, а также приведены результаты тестирования его основных функций, подтверждающие корректность его работы. Описано развертывание приложения в контейнере, демонстрирующее его переносимость на другие персональные компьютеры.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В ходе выпускной квалификационной работы были изучены различные способы генерации текста с помощью различных видов нейронных сетей. Был проведен сравнительный анализ рассмотренных способов генерации по двум критериям, после чего генерация с помощью рекуррентных нейронных сетей была выбрана как наиболее перспективная для решения поставленной задачи. Был подготовлен набор данных для обучения генеративной рекуррентной нейронной сети, включающий в себя предложения на английском языке, взятые из нескольких источников. С целью отбора необходимых предложений был разработан классификатор, позволяющий отбирать наиболее подходящие для демонстрации определенной грамматической формы глагола предложения.
После подготовки набора данных были проведены эксперименты с различными структурами генеративной нейронной сети, обученными на различных подмножествах подготовленного набора данных. В ходе экспериментов было продемонстрировано влияние набора данных на результаты генерации, а также определена приблизительная скорость работы модели при запуске без использования графического ускорителя.
После проведения экспериментов было выполнено проектирование графического приложения, которое может использоваться для составления тестовых заданий с помощью обученной генеративной модели. В ходе реализации были созданы функции для генерации предложения и тестового вопроса, а также построено приложение с графическим интерфейсом, после чего выполнено его тестирование. В завершение приложение было развернуто в контейнере на платформе Docker для демонстрации его переносимости на другие персональные компьютеры.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Жигальская Н.С. Моделирование дидактической структуры электронных учебных комплексов // Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование». 2008. № 27(127). Вып. 2. C. 4-9.
2. Tai, Y., He, H., Zhang, W., Jia, Y. Automatic Generation of Review Content in Specific Domain of Social Network Based on RNN. // 2018 IEEE Third International Conference on Data Science in Cyberspace (DSC), 601-608.
3. Elman J. L. Finding structure in time // Cognitive Science, Vol. 14, No. 2, 1990, pp. 179-211.
4. Cho, K., Merrienboer, B.V., Gülçehre, Ç., Bahdanau, D., Bougares, F., Schwenk, H., Bengio, Y. Learning Phrase Representations using RNN En¬coder–Decoder for Statistical Machine Translation. // EMNLP 2014.
5. Hochreiter, S., Schmidhuber, J. Long short-term memory. // Neural computation vol. 9,8 (1997): 1735-80.
6. Graves A. Generating Sequences with Recurrent Neural Networks // ArXiv, abs/1308.0850, 2013 г.
7. Mikolov, T., Chen, K., Corrado, G.S., Dean, J. Efficient Estimation of Word Representations in Vector Space. // ICLR 2013.
8. Pennington, J., Socher, R., Manning, C.D. GloVe: Global Vectors for Word Representation. // EMNLP 2014.
9. Embedding projector – visualization of high-dimensional data. [Электронный ресурс] URL: https://projector.tensorflow.org(дата обращения: 10.05.2022 г.).
10. Yoo, J.Y., Morris, J.X., Lifland, E., Qi, Y. Searching for a Search Method: Benchmarking Search Algorithms for Generating NLP Adversarial Ex-amples. // ArXiv, abs/2009.06368, 2020 г..
11. Edunov, S., Ott, M., Auli, M., Grangier, D. Understanding Back-Translation at Scale. // EMNLP 2018.
12. Kalchbrenner, N., Espeholt, L., Simonyan, K., Oord, A.V., Graves, A., Kavukcuoglu, K. Neural Machine Translation in Linear Time. // ArXiv, abs/1610.10099, 2016 г.
13. Oord, A.V., Dieleman, S., Zen, H., Simonyan, K., Vinyals, O., Graves, A., Kalchbrenner, N., Senior, A.W., Kavukcuoglu, K. WaveNet: A Generative Model for Raw Audio. // ArXiv, abs/1609.03499, 2016 г.
14. Vaswani, A., Shazeer, N.M., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L., Polosukhin, I. Attention is All you Need. // ArXiv, abs/1706.03762, 2017 г.
15. AI Dungeon. [Электронный ресурс] URL: https://aidungeon.io(да¬та обращения: 10.05.2022 г.).
16. Tatoeba: Collection of sentences and translations. [Электронный ресурс] URL: https://tatoeba.org(дата обращения: 10.05.2022 г.).
17. NLTK :: Natural Language Toolkit. [Электронный ресурс] URL: https://www.nltk.org(дата обращения: 10.05.2022 г.).
18. Pedregosa F, Varoquaux, Gael, Gramfort A, Michel V, Thirion B, Grisel O. Scikit-learn: Machine learning in Python. // Journal of machine learn¬ing research. 12(Oct):2825–30, 2011 г.
19. Chen, T., Guestrin, C. XGBoost: A Scalable Tree Boosting Sys¬tem. // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016 г.
20. HC Corpora. [Электронный ресурс] URL: http://corpora.epizy.com/index.html(дата обращения: 26.05.2022 г.).
21. Flickr. [Электронный ресурс] URL: https://www.flickr.com(дата обращения: 26.05.2022 г.).
22. Bowman, S.R., Angeli, G., Potts, C., Manning, C.D. A large annotat¬ed corpus for learning natural language inference. // EMNLP 2015.
23. Wikipedia, the free encyclopedia. [Электронный ресурс] URL: https://en.wikipedia.org/wiki/Main_Page(дата обращения: 26.05.2022 г.).
24. Keras: the Python deep learning API. [Электронный ресурс] URL: https://keras.io(дата обращения: 10.05.2022 г.).
25. TensorFlow. [Электронный ресурс] URL: https://www.tensorflow.org(дата обращения: 10.05.2022 г.).
26. PyTorch 1.11.0 documentation. [Электронный ресурс] URL: https://pytorch.org/docs/stable/index.html(дата обращения: 19.05.2022 г.).
27. Munjal, R., Arif, S., Wendler, F., Kanoun, O. Comparative Study of Machine-Learning Frameworks for the Elaboration of Feed-Forward Neural Networks by Varying the Complexity of Impedimetric Datasets Synthesized Us-ing Eddy Current Sensors for the Characterization of Bi-Metallic Coins. // Sen-sors (Basel, Switzerland), 22, 2022 г.
28. GIFT format – MoodleDocs. [Электронный ресурс] URL: https://docs.moodle.org/400/en/GIFT_format(дата обращения: 24.05.2022 г.).
29. Miniconda – Conda documentation. [Электронный ресурс] URL: https://docs.conda.io/en/latest/miniconda.html(дата обращения: 24.05.2022 г.).
30. Spyder 5 documentation. [Электронный ресурс] URL: https://docs.spyder-ide.org/current/index.html(дата обращения: 10.05.2022 г.).
31. Windows Subsystem for Linux Documentation | Microsoft Docs. [Электронный ресурс] URL: https://docs.microsoft.com/en-us/windows/wsl/(дата обращения: 24.05.2022 г.).
32. Bird S, Klein E, Loper E. Natural language processing with Python: analyzing text with the natural language toolkit. // O’Reilly Media, Inc., 2009 г.
33. Pattern: Web mining module for Python. [Электронный ресурс] URL: https://github.com/clips/pattern(дата обращения: 10.05.2022 г.).
34. Tkinter – Python interface to Tcl/Tk. [Электронный ресурс] URL: https://docs.python.org/3/library/tkinter.html(дата обращения: 10.05.2022 г.).
35. Docker Documentation. [Электронный ресурс] URL: https://docs.docker.com(дата обращения: 30.05.2022 г.).

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ