🔍 Поиск работ

Разработка системы автоматической генерации заголовков новостных статей на основе нейросетевых технологий

Работа №209297

Тип работы

Дипломные работы, ВКР

Предмет

программирование

Объем работы44
Год сдачи2021
Стоимость4440 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
2
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 6
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 8
2.1. Обзор алгоритмов токенизации 8
2.2. Обзор подходов к решению задачи суммаризации 10
2.2.1. Extractive 11
2.2.2. Abstractive 15
2.3. Метрики качества 20
2.4. Набор данных 22
3. ПРОЕКТИРОВАНИЕ 23
3.1. Требование к системе 23
3.2. Архитектура системы 23
3.3. Варианты использования приложения 24
3.4. Проектирование интерфейса приложения 26
4. РЕАЛИЗАЦИЯ 28
4.1. Программные средства реализации 28
4.2. Обучение нейронных сетей 28
4.3. Разработка приложения 29
5. ТЕСТИРОВАНИЕ 33
5.1. Тестирование архитектур нейронной сети 33
5.2. Функциональное тестирование приложения 33
5.3. Тестирование работы нейронной сети 34
ЗАКЛЮЧЕНИЕ 40
ЛИТЕРАТУРА 41


В современном мире человека постоянно окружает информация, представленная в письменном виде. Каждый секунду тысячи новых фрагментов текста появляются и исчезают. Такая перегрузка информацией заметно изменила способ ее получения и обработки. Пользователи стали более требовательны к емкости информации, то есть к обработке больших объемом данных за меньшее количество времени. В свою очередь производители информации, все чаще конкурируют друг с другом за внимание пользователя. Это вынуждает их производить все более сжатую информацию и делать это как можно быстрее. Следовательно, существует все возрастающая потребность в автоматических системах, способных получать наиболее актуальную текстовую информацию и выводить ее кратчайшим и наиболее информативным возможным способом.
Заголовок является наиболее информативной частью статьи и пользователь, при выборе источника информации, в первую очередь руководствуется им. Заголовок в первую очередь должен отражать основной смысл статьи. В нем не должно быть нарушена логическая связь между словами, отсутствовать смысловая законченность и прямой порядок слов.
Таким образом, разработка системы автоматической генерации заголовков новостных статей является актуальной задачей:
Цель и задачи
Целью данной работы является разработка системы автоматической генерации заголовков новостных статей. Для достижение этой цели необходимо решить следующие задачи :
1) произвести анализ предметной области, изучить существующие методы и подходы;
2) протестировать архитектуры нейронной сети;
3) разработать систему автоматической генерации заголовков новостных статей;
4) протестировать работоспособность разработанной системы.
Структура и объем
Выпускная квалификационная работа состоит из введения, пяти основных разделов, заключения и библиографии. Объем работы составляет 44 страниц, объем библиографии - 26 наименований.
Краткий обзор содержания работы
В первом разделе «Анализ предметной области» приводится история и способы решения задачи суммаризации. Во втором разделе «Теоретическая часть» описывается обзор алгоритмов предобработки текстовых данных, нейросетевые модели для обработки естественного языка, а также описываются метрики качества. В третьем разделе «Проектирование» описываются требования к системе, варианты использования системы, приводится проектирование интерфейса приложения. В четвертом разделе «Реализация» описываются средства реализации, параметры обучения модели. В пятом разделе «Тестирование» приводятся результаты тестирования моделей нейронной сети и вебинтерфейса. В заключение приводятся основные результаты работы и направления дальнейших исследований.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках данной работы были обучены нейронной сети для задачи генерации краткого содержания, а также было реализовано приложение для генерации новостных заголовков на основе нейросетевых технологий.
В ходе разработки были решены задачи, перечисленные ниже:
1) выполнен анализ предметной области;
2) протестированы архитектуры нейронный сети;
3) разработана система автоматической генерации заголовков новостных статей;
4) протестирована работоспособность разработанной системы.
В будущем планируется продолжить тестировать модели нейронных сетей для более качественного составления заголовков.



1. H. P. Luhn, "The Automatic Creation of Literature Abstracts," in IBM Journal of Research and Development, vol. 2, no. 2, pp. 159-165, Apr. 1958, doi: 10.1147/rd.22.0159.
2. Buyukkokten O., Garcia-Molina H., Paepcke A. Seeing the whole in parts: text summarization for web browsing on handheld devices //Proceedings of the 10th international conference on World Wide Web. - 2001. - С. 652-662.
3. Linke-Ellis N. Closed captioning in America: Looking beyond compliance //Proceedings of the TAO Workshop on TV Closed Captions for the Hearing Impaired People, Tokyo, Japan. - 1999. - С. 43-59.
4. Banko M., Mittal V. O., Witbrock M. J. Headline generation based on statistical translation //Proceedings of the 38th Annual Meeting of the Association for Computational Linguistics. - 2000. - С. 318-325.
5. Erkan G., Radev D. R. Lexrank: Graph-based lexical centrality as salience in text summarization //Journal of artificial intelligence research. - 2004. - Т. 22. - С. 457-479.
6. Mihalcea R., Tarau P. Textrank: Bringing order into text //Proceedings of the 2004 conference on empirical methods in natural language processing. - 2004. - С. 404-411.
7. Sennrich R., Haddow B., Birch A. Neural machine translation of rare words with subword units //arXiv preprint arXiv:1508.07909. - 2015.
8. Radford A. et al. Improving language understanding by generative pre-training (2018). - 2018.
9. Schuster M., Nakajima K. Japanese and korean voice search //2012 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). - IEEE, 2012. - С. 5149-5152.
10. Nallapati R., Zhai F., Zhou B. Summarunner: A recurrent neural network based sequence model for extractive summarization of documents //Proceedings of the AAAI Conference on Artificial Intelligence. - 2017. - Т. 31. - №. 1.
11. Chung J. et al. Empirical evaluation of gated recurrent neural networks on sequence modeling //arXiv preprint arXiv:1412.3555. - 2014.
12. Devlin J. et al. Bert: Pre-training of deep bidirectional transformers for language understanding //arXiv preprint arXiv:1810.04805. - 2018.
13. Ba J. L., Kiros J. R., Hinton G. E. Layer normalization //arXiv preprint arXiv:1607.06450. - 2016.
14. Vaswani A. et al. Attention is all you need //arXiv preprint arXiv:1706.03762. - 2017.
15. See A., Liu P. J., Manning C. D. Get to the point: Summarization with pointer-generator networks //arXiv preprint arXiv:1704.04368. - 2017.
..26


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ