📄Работа №209297

Тема: Разработка системы автоматической генерации заголовков новостных статей на основе нейросетевых технологий

Характеристики работы

Тип работы Дипломные работы, ВКР
Программирование
Предмет Программирование
📄
Объем: 44 листов
📅
Год: 2021
👁️
Просмотров: 29
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

ВВЕДЕНИЕ 4
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 6
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 8
2.1. Обзор алгоритмов токенизации 8
2.2. Обзор подходов к решению задачи суммаризации 10
2.2.1. Extractive 11
2.2.2. Abstractive 15
2.3. Метрики качества 20
2.4. Набор данных 22
3. ПРОЕКТИРОВАНИЕ 23
3.1. Требование к системе 23
3.2. Архитектура системы 23
3.3. Варианты использования приложения 24
3.4. Проектирование интерфейса приложения 26
4. РЕАЛИЗАЦИЯ 28
4.1. Программные средства реализации 28
4.2. Обучение нейронных сетей 28
4.3. Разработка приложения 29
5. ТЕСТИРОВАНИЕ 33
5.1. Тестирование архитектур нейронной сети 33
5.2. Функциональное тестирование приложения 33
5.3. Тестирование работы нейронной сети 34
ЗАКЛЮЧЕНИЕ 40
ЛИТЕРАТУРА 41

📖 Аннотация

В данной работе представлена разработка системы автоматической генерации заголовков для новостных статей с применением нейросетевых технологий. Актуальность исследования обусловлена проблемой информационной перегрузки и необходимостью быстрого создания кратких, содержательных заголовков, которые являются ключевым элементом для привлечения внимания пользователя и точного отражения сути материала. В ходе работы были проанализированы существующие подходы к суммаризации текста, включая экстрактивные и абстрактивные методы, а также обучены и протестированы различные архитектуры нейронных сетей для решения поставленной задачи. Основным результатом стало функционирующее приложение, способное генерировать заголовки на основе содержания статей. Научная значимость работы заключается в сравнительном анализе нейросетевых моделей для абстрактивной генерации текста, а практическая — в создании инструмента, способного автоматизировать и ускорить процесс создания контента в медиасфере. Теоретической основой исследования послужили труды таких авторов, как Х.П. Лухн, заложивший основы автоматического реферирования, М. Банко с коллегами, исследовавшими генерацию заголовков на основе статистического перевода, а также Г. Эркан и Д.Р. Радев, разработавшие графовый алгоритм LexRank для экстрактивной суммаризации, и Р. Михаилча, внесшая вклад в оценку качества подобных систем.

📖 Введение

В современном мире человека постоянно окружает информация, представленная в письменном виде. Каждый секунду тысячи новых фрагментов текста появляются и исчезают. Такая перегрузка информацией заметно изменила способ ее получения и обработки. Пользователи стали более требовательны к емкости информации, то есть к обработке больших объемом данных за меньшее количество времени. В свою очередь производители информации, все чаще конкурируют друг с другом за внимание пользователя. Это вынуждает их производить все более сжатую информацию и делать это как можно быстрее. Следовательно, существует все возрастающая потребность в автоматических системах, способных получать наиболее актуальную текстовую информацию и выводить ее кратчайшим и наиболее информативным возможным способом.
Заголовок является наиболее информативной частью статьи и пользователь, при выборе источника информации, в первую очередь руководствуется им. Заголовок в первую очередь должен отражать основной смысл статьи. В нем не должно быть нарушена логическая связь между словами, отсутствовать смысловая законченность и прямой порядок слов.
Таким образом, разработка системы автоматической генерации заголовков новостных статей является актуальной задачей:
Цель и задачи
Целью данной работы является разработка системы автоматической генерации заголовков новостных статей. Для достижение этой цели необходимо решить следующие задачи :
1) произвести анализ предметной области, изучить существующие методы и подходы;
2) протестировать архитектуры нейронной сети;
3) разработать систему автоматической генерации заголовков новостных статей;
4) протестировать работоспособность разработанной системы.
Структура и объем
Выпускная квалификационная работа состоит из введения, пяти основных разделов, заключения и библиографии. Объем работы составляет 44 страниц, объем библиографии - 26 наименований.
Краткий обзор содержания работы
В первом разделе «Анализ предметной области» приводится история и способы решения задачи суммаризации. Во втором разделе «Теоретическая часть» описывается обзор алгоритмов предобработки текстовых данных, нейросетевые модели для обработки естественного языка, а также описываются метрики качества. В третьем разделе «Проектирование» описываются требования к системе, варианты использования системы, приводится проектирование интерфейса приложения. В четвертом разделе «Реализация» описываются средства реализации, параметры обучения модели. В пятом разделе «Тестирование» приводятся результаты тестирования моделей нейронной сети и вебинтерфейса. В заключение приводятся основные результаты работы и направления дальнейших исследований.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В рамках данной работы были обучены нейронной сети для задачи генерации краткого содержания, а также было реализовано приложение для генерации новостных заголовков на основе нейросетевых технологий.
В ходе разработки были решены задачи, перечисленные ниже:
1) выполнен анализ предметной области;
2) протестированы архитектуры нейронный сети;
3) разработана система автоматической генерации заголовков новостных статей;
4) протестирована работоспособность разработанной системы.
В будущем планируется продолжить тестировать модели нейронных сетей для более качественного составления заголовков.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. H. P. Luhn, "The Automatic Creation of Literature Abstracts," in IBM Journal of Research and Development, vol. 2, no. 2, pp. 159-165, Apr. 1958, doi: 10.1147/rd.22.0159.
2. Buyukkokten O., Garcia-Molina H., Paepcke A. Seeing the whole in parts: text summarization for web browsing on handheld devices //Proceedings of the 10th international conference on World Wide Web. - 2001. - С. 652-662.
3. Linke-Ellis N. Closed captioning in America: Looking beyond compliance //Proceedings of the TAO Workshop on TV Closed Captions for the Hearing Impaired People, Tokyo, Japan. - 1999. - С. 43-59.
4. Banko M., Mittal V. O., Witbrock M. J. Headline generation based on statistical translation //Proceedings of the 38th Annual Meeting of the Association for Computational Linguistics. - 2000. - С. 318-325.
5. Erkan G., Radev D. R. Lexrank: Graph-based lexical centrality as salience in text summarization //Journal of artificial intelligence research. - 2004. - Т. 22. - С. 457-479.
6. Mihalcea R., Tarau P. Textrank: Bringing order into text //Proceedings of the 2004 conference on empirical methods in natural language processing. - 2004. - С. 404-411.
7. Sennrich R., Haddow B., Birch A. Neural machine translation of rare words with subword units //arXiv preprint arXiv:1508.07909. - 2015.
8. Radford A. et al. Improving language understanding by generative pre-training (2018). - 2018.
9. Schuster M., Nakajima K. Japanese and korean voice search //2012 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). - IEEE, 2012. - С. 5149-5152.
10. Nallapati R., Zhai F., Zhou B. Summarunner: A recurrent neural network based sequence model for extractive summarization of documents //Proceedings of the AAAI Conference on Artificial Intelligence. - 2017. - Т. 31. - №. 1.
11. Chung J. et al. Empirical evaluation of gated recurrent neural networks on sequence modeling //arXiv preprint arXiv:1412.3555. - 2014.
12. Devlin J. et al. Bert: Pre-training of deep bidirectional transformers for language understanding //arXiv preprint arXiv:1810.04805. - 2018.
13. Ba J. L., Kiros J. R., Hinton G. E. Layer normalization //arXiv preprint arXiv:1607.06450. - 2016.
14. Vaswani A. et al. Attention is all you need //arXiv preprint arXiv:1706.03762. - 2017.
15. See A., Liu P. J., Manning C. D. Get to the point: Summarization with pointer-generator networks //arXiv preprint arXiv:1704.04368. - 2017.
..26

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ