ВВЕДЕНИЕ 3
1 Теоретические основы исследования 8
1.1 Жанровые особенности новостного текста и лида 8
1.2 Автоматизированная журналистика 10
1.3 Компьютерная лингвистика и её задачи 12
1.3 Машинное обучение и его роль в компьютерной лингвистике 13
1.4 Архитектура нейронной сети 14
1.4.1 Нейронные сети для работы с последовательностями 17
1.4.2 Трансформерная архитектура 23
1.5 Большие языковые модели 24
1.6 Задача суммаризации 28
1.6.1 Экстрактивный подход к задаче суммаризации 28
1.6.2 Абстрактивный подход к задаче суммаризации 29
1.6.3 Применение экстрактивных и абстрактивных методов суммаризации 31
ВЫВОДЫ ПО ПЕРВОЙ ГЛАВЕ 32
2 Архитектура языковой модели и процесс обучения 34
2.1 Архитектура GPT-2 34
2.2 Трансферное обучение 37
2.2.1 Параметрически эффективная настройка 38
2.2.2 Параметры и гиперпараметры модели 40
2.3 Метрики качества 40
2.4 Сбор, анализ и обработка данных 43
2.5 Используемый набор данных 44
2.6 Тонкая настройка модели 46
2.7 Результаты тонкой настройки 47
2.8 Оценка эффективности модели 52
ЗАКЛЮЧЕНИЕ 59
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 61
Появление Интернета ознаменовало всплеск распространения информации во всех её формах, что значительно ускорило развитие многих наук [47]. Конечно, такие разделы лингвистики, как автоматическая обработка естественного языка и компьютерная лингвистика, также претерпели изменения. Компьютерная лингвистика — междисциплинарная область знаний, которая возникла на стыке лингвистики, математики, информатики и искусственного интеллекта. В компьютерной лингвистике объектом исследований являются тексты на естественном языке, а в качестве основного инструмента изучения языка используются компьютерные программы, компьютерные технологии организации и обработки данных [46]. Как особое научное направление компьютерных лингвистика связана с областью искусственного интеллекта, в рамках которой разрабатываются программные модели отдельных интеллектуальных функций.
Проблематика компьютерной лингвистики часто связывается с обеспечением взаимодействия человека с ЭВМ на естественном языке, а также с теорией и практикой информационно-поисковых систем. Обеспечение общения человека с ЭВМ на естественном языке иногда называется «обработка естественного языка». Оно изучает проблемы компьютерного анализа и синтеза естественного языка [52]. Данное направление возникло за рубежом в 1950 году после публикации основополагающей работы в области искусственного интеллекта «Вычислительные машины и разум», написанной английским учёным Аланом Тьюрингом. В настоящее время обработка естественного языка применяется для решения многих задач, основными из которых являются распознавание речи, понимание естественного языка и генерация естественного языка. Последнее является одним из наиболее актуальных направлений и применяется в роботизированной журналистике.
Автоматизация изменила работу журналистов: от анализа огромных объёмов данных до путей распространения информации. Роботизированная журналистика перешла на новый этап с появлением автоматической генерации текстов [17]. С помощью программ искусственного интеллекта статьи создаются компьютерами, а не людьми. Эти программы интерпретируют, систематизируют и представляют данные понятными для человека способами. Каждый этап процесса создания новости теперь может быть автоматизирован: «роботы-журналисты» могут создавать тысячи статей практически без больших затрат.
Из-за формульной природы автоматизации роботизированная журналистика в основном используется для создания новостей на основе статистики и числовых данных. Общие темы включают спортивные обзоры, погоду, финансовые отчеты, анализ недвижимости и обзоры доходов. В ноябре 2010 года цифровая медиакомпания Statsheet запустила сеть из 345 веб-сайтов, посвященных студенческим баскетбольным командам. Эти команды ежемесячно публикуют более 15 000 отчетов о матчах, обзоров игр и прочих статей, созданных без какого-либо вмешательства людей [39]. Алгоритмы автоматически генерируют тексты на основе игровой статистики и набора стандартных фраз. Associated Press начал использовать автоматизацию для охвата 10 000 игр в малые бейсбольные лиги ежегодно, используя программу от Automated Insights и статистику от MLB Advanced Media [32]. В мае 2020 Mi¬crosoft объявил, что заменит на роботов десятки журналистов, которые работают на портале корпорации MSN [4]. 8 сентября 2020 года The Guardian опубликовал статью, полностью сгенерированную нейронной сетью GPT-3 и отредактированную редактором-человеком [1].
Роботизированная журналистика имеет несколько преимуществ. Во-первых, автоматизация значительно увеличивает скорость и объемы производства информации. Associated Press объявил в 2014 году, что полностью автоматизирует написание отчетов о корпоративных доходах. Используя программное обеспечение Automated Insights и данные других компаний, они могут выпускать статьи объемом от 150 до 300 слов, в то же время журналистам приходится собирать цифры и готовить информацию [10]. Франческо Маркони из Associated Press заявил, что благодаря автоматизации информационное агентство освободило 20 процентов времени журналистов, чтобы сосредоточиться на проектах с более высокой отдачей.
Кроме того, автоматизированная журналистика экономически более выгодна, поскольку позволяет производить больше информации за меньшее время. Это также уменьшает затраты на рабочую силу для новостных организаций, поскольку сокращает расходы на заработную плату, оплачиваемый отпуск, отпускные и страхование трудовой деятельности. Автоматизация является эффективным инструментом для снижения издержек для новостных агентств, сталкивающихся с ограниченным бюджетом, но стремящихся сохранить объем и качество своего новостного охвата.
В данной работе представлена попытка применения искусственной нейронной сети ruGPT-3 для построения прототипа модели реферирования текста на примере генерации лида новостных текстов. Также рамках данной работы будут обучены языковые модели ruGPT-3 Medium и ruGPT-3 Large с применением метода LoRA. Предполагается, что данный метод позволит использовать значительно меньшее вычислительных ресурсов для обучения без потери качества по сравнению с другими методами. Для проверки данной гипотезы будет обучены две модели с применением данного метода и без. Результаты будут оцениваться с помощью формальных метрик (BLEU, METEOR, ROUGE, BERTScore).
Работа осуществляется в рамках проекта «Эпигон», разрабатываемого лабораторией лингвистической антропологии Национального исследовательского Томского Государственного Университета. Основной целью проекта является разработка цифровой платформы на основе применения алгоритмов и методов распознавания спонтанной речи и синтеза текста пресс-релизов и новости с целью автоматизации подготовки и публикации материалов в СМИ. В команду проекта входят научные сотрудники «Лаборатории лингвистической антропологии» и кафедры общей, компьютерной и когнитивной лингвистики ТГУ и программисты ООО «Интеллиджент Профит Солюшнс Томск» (ООО «АйПиЭсТи»). Команда проекта состоит из представителей различных областей знаний, что позволяет сформировать и использовать междисциплинарных подход для решения автоматического формирования новостных блоков на основе использования новейших достижений в области информационных и лингвистических технологий (технологии формальных грамматик и онтологий, баз знаний, машинного обучения, нейронных сетей). Проект выполняется под руководством З.И. Резановой и А.А. Степаненко.
За время реализации проекта апробирована генерация новостных заголовков на русском языке при помощи нейронных сетей (А.А. Шевчук, А.И. Здоровец, Д.А. Аишева). В предыдущих исследования использовались нейронные сети с архитектурами sequence-to-sequence (А.А. Шевчук), DEEP SEQ2SEQ (А.И. Здоровец) и Transformer (Д.А. Аишева).
Основываясь на результатах ранее проведенных исследований, в данной магистерской работе решается задача по автоматической генерации лидов новостных текстов посредством суммаризации. Разработка и создание инструмента осуществляется с помощью русскоязычной модели искусственной нейронной сети ruGPT-3.
Актуальность данной работы обусловлена нарастающей потребностью в эффективных инструментах для обработки текстовой информации в сфере новостей и медиа. В со-временном информационном обществе огромное количество данных генерируется и распространяется мгновенно, что требует быстрой и точной обработки. Оперативность стала ключевым фактором успеха в конкурентной среде новостных агентств и изданий. Разработка прототипа сервиса автоматической генерации новостных лидов на основе нейронной сети ruGPT-3 имеет большой потенциал для решения этих проблем. Нейронные сети обладают способностью обрабатывать и анализировать большие объемы текстовой информации, выделять ключевые аспекты и генерировать краткие и содержательные тексты. Кроме того, автоматическая генерация лидов на основе нейронных сетей может существенно улучшить работу журналистов и редакторов, освободив их от рутинных задач и позволив сконцентрироваться на более творческой и аналитической работе. Сокращение времени, затрачиваемого на прочитывание новостного текста и написания лида, позволит срочно реагировать на новости и оперативно создавать информационные продукты.
Основным материалом для исследования послужили новостные материалы с сайта федерального информационного агентства ТАСС объемом 33 000 текстов по рубрикам «Россия», «Мир» и «Коронавирус» с 2021 по 2023 годы. Набор данных состоит из заголовков, лидов, текстов новостей и ссылок на новость. Новостные материалы были получены путем извлечения данных с официального веб-сайта информационного агентства ТАСС с использованием специального парсера.
Объектом исследования является автоматическое реферирование текстов.
Предметом исследования является технология реферирования текста с применением нейронной сети на основе ruGPT-3 на примере генерации лидов новостных текстов и метода LoRA.
Цель работы состоит в создании и сравнении прототипов системы автоматической генерации лидов новостных текстов на основе нейронной сети ruGPT-3 с использованием метода LoRA и без него. Дополнительно было проведено сравнение эффективности модели ruGPT-3 Medium, обученной на наборе данных по одной рубрике ("Коронавирус"), и модели, обученной на смешанном наборе данных.
Достижение поставленной цели определяет круг задач:
1. Изучить особенности новостного текста, правил его построения, особенностей лида в структуре новости;
2. Изучить нейронные сети и определить потенциал их использования для задач реферирования, опыт их применения для решения задач генерации лидов;
3. Изучить особенности применения нейронной сети ruGPT-3 для решения задачи генерации лида новостных текстов;
4. Обучить языковую модель ruGPT-3 Medium и ruGPT-3 Large с применением техники LoRA и без неё;
5. Сравнить результаты моделей ruGPT-3 Medium, обученных на специфических данных одной рубрике и на смешанных данных;
6. Сравнить эффективность моделей с помощью метрик качества.
В настоящем исследовании использовались следующие методы: для сбора материала была написана программа на языке Python для автоматизированного сбора и структурирования информации с вебсайта ТАСС; для подготовки компьютерного анализа текстов применялись методы предварительной обработки текстов; в практической части использовались методы машинного обучения и методы оценки качества нейронных сетей. Реализация программного кода для решения поставленной задачи была написана на языке программировании Python.
Научная новизна исследования заключается в том, что данная работа находится в числе первых исследований, обращающихся к проблеме генерации лидов при помощи нейронных сетей на материале русскоязычных текстов. Научная новизна исследования заключается в применении нейронной сети ruGPT-3 с инновационным методом LoRA для решения задачи генерации лидов новостных текстов на русском языке. Данный подход ранее не применялся для данной задачи, и работа предоставляет новые эмпирические данные о его эффективности.
Теоретическая значимость работы определяется ее вкладом в проверку эффективности разрабатываемого инструмента в решении задачи генерации лидов на русском языке. Работа вносит вклад в дальнейшее развитие темы автоматической генерации лидов новостных текстов и исследует эффективность использования метода LoRA для адаптации моделей к задачам, связанных с русским языком. Практическая значимость работы заключается в том, что созданный прототип может послужить основой для разработки практических инструментов автоматической генерации лидов новостных текстов на русском языке. Использование таких инструментов может повысить эффективность работы журналистов, ускорить процесс создания новостей и обеспечить более оперативное освещение событий.
В ходе выполнения настоящего исследования были достигнуты следующие результаты, которые подтвердили эффективность подходов, предложенных в работе, и значимость тонкой настройки языковых моделей для генерации новостных лидов.
В первой главе проведен теоретический анализ жанровых особенностей новостного текста и лида, роли автоматизированной журналистики, задач компьютерной лингвистики и применения машинного обучения в этой области. Было рассмотрено использование нейронных сетей, в частности трансформерной архитектуры и больших языковых моделей, для решения задач суммаризации текстов.
Вторая глава была посвящена экспериментальной части исследования. Основное внимание было уделено архитектуре GPT-2 и процессу трансферного обучения. Были рас-смотрены параметры и гиперпараметры больших языковых моделей, методы оценки качества генерации текстов, а также процесс сбора, анализа и обработки данных. Особое внимание уделено тонкой настройке моделей и анализу результатов.
В ходе экспериментов была проведена тонкая настройка моделей ruGPT-3 Medium и ruGPT-3 Large. Для изучения влияния рубрики на качество генерации текста были дообучены две модели ruGPT-3 Medium: одна на наборе данных, содержащем новостные тексты только из рубрики «Коронавирус», другая — на смешанном наборе данных из нескольких рубрик. Объемы обучающих наборов данных были одинаковы и составляли 8 700 новостных текстов.
Результаты показали, что модель, обученная на специфической рубрике, продемонстрировала лучшие результаты по ряду метрик в сравнении с моделью, обученной на смешанном наборе данных. В частности, различия в показателях ROUGE-1, ROUGE-2, ROUGE-L и BLEU были статистически значимыми (p < 0.05), что свидетельствует о достоверности лучшего качества генерации модели, обученной на текстах по рубрике «Коронавирус». Это подтверждает важность выбора подходящего обучающего набора данных для специфических задач генерации текстов.
Дополнительно была проведена тонкая настройка моделей ruGPT-3 Medium и ruGPT-3 Large с применением метода LoRA. Результаты показали, что модель ruGPT-3 Large, дообученная с использованием LoRA, демонстрирует более высокое качество генерации текстов по сравнению с моделями ruGPT-3 Medium, что обусловлено большим количеством обучаемых параметров.
Проведенное исследование подтвердило, что тонкая настройка языковых моделей на специфических наборах данных является важным и эффективным инструментом для улучшения качества генерации текстов. Модель ruGPT-3 Medium, обученная на специфических данных для задачи суммаризации новостных текстов, показала лучшие результаты по срав-нению с универсальной моделью GPT-4o, что подчеркивает значимость и необходимость тонкой настройки в задачах генерации текстов для узкоспециализированных областей.
Таким образом, результаты работы демонстрируют, что подходы и методы, предложенные в исследовании, могут быть успешно применены для автоматической генерации новостных лидов высокого качества, что открывает перспективы для дальнейших исследований и разработок в области автоматизированной журналистики и компьютерной лингвистики.
1. A robot wrote this entire article. Are you scared yet, human? - URL: https://www.theguardian.com/commentisfree/2020/sep/08/robot-wrote-this-article-gpt-3(дата обращения: 13.04.2024). - Текст : электронный.
2. Aghajanyan A. Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-Tuning / A. Aghajanyan, L. Zettlemoyer, S. Gupta. - 2020.
3. Artificial Intelligence and Automated Journalism: Contemporary Challenges and New Opportunities // International Journal of Media, Journalism and Mass Communications. - 2019. - Т. 5. - № 1.
4. Baker G. Microsoft is cutting dozens of MSN news production workers and replacing them with artificial intelligence. - URL: https://www.seattletimes.com/business/local- business/microsoft-is-cutting-dozens-of-msn-news-production-workers-and-replacing-them- with-artificial-intelligence/(дата обращения: 16.04.2024). - Текст : электронный.
5. BART: Denoising sequence-to-sequence pre-training for natural language generation, translation, and comprehension / M. Lewis, Y. Liu, N. Goyal [и др.] // Proceedings of the Annual Meeting of the Association for Computational Linguistics. - 2020. - С. 7871-7880.
6. BERT: Pre-training of deep bidirectional transformers for language understanding / J. Devlin, M. W. Chang, K. Lee, K. Toutanova // NAACL HLT 2019 - 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies - Proceedings of the Conference. - Association for Computational Linguistics (ACL), 2019. - Т. 1. - С. 4171-4186.
7. BLEU / K. Papineni, S. Roukos, T. Ward, W.-J. Zhu // Proceedings of the 40th Annual Meeting on Association for Computational Linguistics - ACL ’02. - Morristown, NJ, USA : Association for Computational Linguistics, 2001. - С. 311.
8. Brown T. Language models are few-shot learners. Т. 33 / T. Brown, et al. - 2020.
9. Church K. The Future of Computational Linguistics: On Beyond Alchemy / K. Church, M. Liberman // Frontiers in Artificial Intelligence. - 2021. - Т. 4.
10. Cohen N. S. From Pink Slips to Pink Slime: Transforming Media Labor in a Digital Age / N. S. Cohen // The Communication Review. - 2015. - Т. 18. - № 2. - С. 98-122.
11. Denkowski M. Meteor Universal: Language Specific Translation Evaluation for Any Target Language / M. Denkowski, A. Lavie // Proceedings of the ninth workshop on statistical machine translation. - 2014. - С. 376-380.
12. Distributed representations of words and phrases and their compositionality / T. Mikolov, I. Sutskever, K. Chen [и др.]. - 2013.
13. Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling / J.
Chung, C. Gulcehre, K. Cho, Y. Bengio. - 2014.
14. Erkan G. LexRank: Graph-based Lexical Centrality as Salience in Text Summarization / G. Erkan, D. R. Radev. - 2011.
15. Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer / C. Raffel, N. Shazeer, A. Roberts [и др.]. - 2019.
16. Fine-Tuning GPT-3 for Russian Text Summarization / N. Alexandr, O. Irina, K. Tatyana [и др.] // Lecture Notes in Networks and Systems. - 2021. - Т. 231 LNNS. - С. 748-757.
17. Franklin B. The future of journalism: Developments and debates / B. Franklin // Journalism studies. - 2012. - Т. 13. - № 5-6. - С. 663-681.
18. Github - The Practical Guides for Large Language Models. - URL: https://github.com/Mooler0410/LLMsPracticalGuide(дата обращения: 08.04.2024). - Текст: электронный.
19. GitHub - sberbank-ai/ru-gpts: Russian GPT3 models.
20. Goloviznina V. S. Automatic Summarization of Russian Texts: Comparison of Extractive and Abstractive Methods / V. S. Goloviznina, E. V. Kotelnikov // Komp’juternaja Lingvistika i Intellektual’nye Tehnologii. - 2022. - Т. 2022. - № 21. - С. 223-235.
21. Gusev I. Dataset for Automatic Summarization of Russian News / I. Gusev. - 2020. - С. 122-134.
22. Improving Language Understanding by Generative Pre-Training / A. Radford, K. Narasimhan, T. Salimans, I. Sutskever // Homology, Homotopy and Applications. - 2018. - Т. 9. - № 1.
23. Jurafsky D. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition / D. Jurafsky, J. H. Martin.
24. Kieuvongngam V. Automatic Text Summarization of COVID-19 Medical Research Articles using BERT and GPT-2 / V. Kieuvongngam, B. Tan, Y. Niu. - 2020.
25. Kunert J. Journalists, meet your new colleague algorithm: The impact of automation on content distribution and content creation in the newsroom / J. Kunert // Media Trust in a Digital World. - 2019. - С. 135-148.
26. Lin C.-Y. ROUGE: A Package for Automatic Evaluation of Summaries / C.-Y. Lin // Text summarization branches out. - 2004. - С. 74-81.
27. Liu X. Reuters Tracer: Toward Automated News Production Using Large Scale Social Media Data / X. Liu // IEEE Internation Conference on Big Data. - 2017. - С. 1483-1493.
28. LoRA: Low-Rank Adaptation of Large Language Models / E. J. Hu, Y. Shen, P. Wallis [и др.]. - 2021.
29. Manning C. D. Human language understanding & reasoning / C. D. Manning //
Daedalus. - 2022. - Т. 151. - № 2. - С. 127-138.
30. Mihalcea R. TextRank: Bringing order into texts / R. Mihalcea, P. Tarau // Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing, EMNLP 2004 - A meeting of SIGDAT, a Special Interest Group of the ACL held in conjunction with ACL 2004.
- 2004. - Т. 85. - С. 404-411.
31. Models - OpenAI API. - URL: https://platform.openai.com/docs/models/gpt-4o(дата обращения: 15.06.2024). - Текст : электронный.
32. Mullin B. The Associated Press will use automated writing to cover the minor leagues.
- URL: https://www.poynter.org/tech-tools/2016/the-associated-press-will-use-automated-
writing-to-cover-the-minor-leagues/ (дата обращения: 15.04.2024). - Текст : электронный.
33. Nabi J. Reccurent Neural Networks (RNNs). - URL:
https://towardsdatascience.com/recurrent-neural-networks-rnns-3f06d7653a85(дата обращения: 11.05.2024). - Текст : электронный.
34. Ouyang L. Training language models to follow instructions with human feedback. Т. 35 / L. Ouyang, et al. - 2022.
35. Polyakova I. Extractive Russian Text Summarization as Greedy Sentence Sequence Continuation Search with Probabilities from Pretrained Language Models / I. Polyakova. - С. 303¬308.
36. Radford A. Language models are unsupervised multitask learners. Т. 1 / A. Radford, et al. - 2019.
37. Risne V. Text summarization using transfer learning Extractive and abstractive summarization using / V. Risne. - 2019. - С. 28.
38. Sarkar D. Natural Language Basics / D. Sarkar // Text Analytics with Python. - Berkeley, CA : Apress, 2016. - С. 1-50.
39. Schonfeld E. Automated News Comes To Sports Coverage Via StatSheet. - URL:
https://techcrunch.com/2010/11/12/automated-news-sports-statsheet/ (дата обращения:
29.03.2024). - Текст : электронный.
40. Sebastian R. Machine Learning with PyTorch and Scikit-Learn / R. Sebastian. - Packt Publishing Ltd, 2022. - 770 с.
41. Sutskever I. Sequence to sequence learning with neural networks / I. Sutskever, O. Vinyals, Q. V Le. - 2014. - Т. 27.
42. Wagner M. Automated Journalism: The Effects of Automated News Generation on News Organizations / M. Wagner. - Technische Universitat Wien, 2022. - 141 с.
43. Wei J. Finetuned language models are zero-shot learners / J. Wei, et al. - 2021.
44. XL-Sum: Large-Scale Multilingual Abstractive Summarization for 44 Languages / T.
Hasan, A. Bhattacharjee, M. S. Islam [и др.] // Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021. - Stroudsburg, PA, USA : Association for Computational Linguistics, 2021. - С. 4693-4703.
45. Yang L. On hyperparameter optimization of machine learning algorithms: Theory and practice / L. Yang, A. Shami // Neurocomputing. - 2020. - Т. 415. - С. 295-316.
46. Баранов А. Н. Компьютерная лингвистика. - URL:
https://old.bigenc.ru/linguistics/text/2087783(дата обращения: 11.05.2024). - Текст:
электронный.
47. Большакова Е. И. Автоматическая обработка текстов на естественном языке и анализ данных / Е. И. Большакова, и др. - М. : Изд-во НИУ ВШЭ, 2017.
48. Боярский К. К. Введение в компьютерную лингвистику / К. К. Боярский. - 2013.
49. Ганегерада Т. Обработка естественного языка с TensorFlow / пер. с анг. В. С. Яценкова / Т. Ганегерада. - М.: ДМК Пресс, 2020. - 382 с.
50. Гафаров Ф. М. Искусственные нейронные сети и приложения: учеб. пособие / Ф. М. Гафаров, А. Ф. Галимянов. - Казань: Изд-во Казан. ун-та, 2018. - 121 с.
51. ИТМО-Викиконспекты. BERT(языковая модель). - URL:
https://neerc.ifmo.ru/wiki/index.php?title=BERT_(языковая модель) (дата обращения: 19.05.2024). - Текст : электронный.
52. ИТМО-Викиконспекты. Обработка естественного языка. - URL: https://neerc.ifmo.ru/wiki/index.php?title=Обработка_естественного_языка (дата обращения: 11.05.2024). - Текст : электронный.
53. Колесниченко А. В. Прикладная журналистика / А. В. Колесниченко. - Москва : Изд-во Моск. ун-та, 2008.
54. Носовец С. Г. Подводки к новостному медиатексту в социальной сети: опыт типологической характеристики / С. Г. Носовец // Mediascope. - 2021. - № 1.
55. Черкасова И. С. Оптимизация гиперпараметров нейронной сети и снижение вычислительных затрат / И. С. Черкасова // E-Scio. - 2022.
56. Шевчук А. А. Генерация новостных заголовком при помощи нейронных сетей: магистерская диссертация по направлению подготовки: 45.04.03 - Фундаментальная и прикладная лингвстика / А. А. Шевчук. - Национальный исследовательский Томский Государственный Университет, 2019.
57. Шостак М. И. Новостная журналистика. Новости прессы : учебник и практикум для вузов / М. И. Шостак. - 2 изд., до. - Москва : Издательство Юрайт, 2023. - 192 с.
58. Янина А. Нейросети для работы с последовательностями. - URL: https://education.yandex.ru/handbook/ml/article/nejroseti-dlya-raboty-s-posledovatelnostyami
(дата обращения: 12.05.2024). - Текст : электронный.