Тип работы:
Предмет:
Язык работы:


ГЕНЕРАЦИЯ ОСМЫСЛЕННЫХ ТЕКСТОВ ЗАДАННОГО ОБЪЁМА И СТИЛЯ

Работа №189631

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы28
Год сдачи2017
Стоимость4650 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
5
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1 Постановка задачи 7
2 Классификация драматических ситуаций 8
3 Критерии осмысленности текста 9
4 Алгоритм на основе семантических сетей 10
4.1 Семантическая сеть 10
4.2 Метод Аббота 10
4.3 Обработка естественного языка 11
4.4 Реализация анализатора 14
4.4.1 Организация работы словаря 15
4.5 Реализация генератора 16
5 Алгоритм на основе формальных грамматик 17
5.1 Формальная грамматика 17
5.2 Древовидная структура предложения 18
5.3 Правила для слов 19
5.4 Анализ текстов 20
5.5 Реализация анализатора 21
5.6 реализация генератора 22
6 Результаты 23
6.1 Алгоритм на основе семантических сетей 23
6.2 Алгоритм на основе формальных грамматик 24
Заключение 25
Литература 26


Компьютерное творчество - одна из наиболее молодых, но притом быстро развивающихся областей исследования в информационных технологиях. И неудивительно, что эти исследования до сих пор стоят перед рядом фундаментальных проблем. Творчество очень сложно, может быть, даже невозможно определить в объективных терминах. Это состояние ума, талант, способность, или процесс? Творчество в большей или меньшей степени присутствует в практически во всех видах человеческой деятельности, и с течением времени компьютеры так же постигают всё новые виды творчества.
Таким образом, можно выделить и рассмотреть отдельно задачу компьютерного литературного творчества, а именно генерацию текста. На данный момент эта область разработок не может похвастаться такими успехами и количеством научных работ, как например, генерация изображений, которая успела пройти долгий путь от теоретических изысканий до непосредственных приложений, представленных широкому кругу пользователей. Наиболее массово используются сгенерированные тексты сейчас в процессе разработки и поисковой оптимизации сайтов: определённые алгоритмы позволяют получать тексты на заданную тематику, после размещения которых на веб-сайте, его место в поисковой выдаче, в силу сравнительной уникальности текста, будет повышено.
Кроме того, набирающим популярность направлением являются чат-боты и виртуальные собеседники - программы, призванные имитировать общение в чатах. Они нередко используются в качестве автоответчиков, способных реагировать на множество запросов пользователей по разным сценариям.
На данный момент известно несколько подходов к генерации текста:
1) Синонимизация, в основе которой лежит идея о создании нового текста из существующего, путём замены отдельных слов или целых фраз на смысловые аналоги. Для применения данного метода требуется богатый словарь синонимов как для отдельных слов, так и для целых выражений.
2) Размножение - вариант синонимизации, включающий в себя перестановку слов, предложений или даже целых абзацев для придания тексту уникальности. Такой подход помимо словаря синонимов требует описания правил, по которым можно осуществлять перестановку в тексте.
3) Цепи Маркова - идея подхода состоит в анализе множества существующих текстов и выделении в них последовательностей из n слов. Затем программа получает на вход n-1 слово и, на основе данных анализа, предлагает слово, которое наиболее вероятно могло бы встретиться после заданных слов. Осмысленность полученного результата напрямую зависит от модификаций алгоритма, так как сам подход осмысленности не гарантирует.
В качестве предметной области данной работы рассматривается слабо охваченная область художественной литературы и предлагается новый подход, а именно генерация на основе сюжетов - предполагается, что каждый текст реализует один из сюжетов, описанных в классификации «36 драматических ситуаций» [2] французского театроведа Жоржа Польти. Кроме того, все тексты предполагается строить с использованием линейной пятиактной структуры повествования: экспозиция, завязка, кульминация, развязка, постпозиция.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе был предложен и реализован метод генерации, с использованием семантических сетей. Был реализован алгоритм, способный после обучения на существующих текстах генерировать новые. Была исследована область обработки естественного языка и существующие подходы к анализу и синтезу текстов.
Первая используемая модель продемонстрировала способность создавать тексты, удовлетворяющие заданному критерию осмысленности, однако текст на выходе не использует средств выразительности языка, так как метод Аббота, заложенный в его основу, ориентирован на работу преимущественно с грамматическими основами, а такие члены предложения, как определение или обстоятельство, несущие дополнительный семантический оттенок, например, места действия, игнорируются.
Вторая используемая модель продемонстрировала способность создавать тексты, каждое предложение которых удовлетворяет критерию осмысленности, однако для человека очевидно, что весь текст не является осмысленным. Причина кроется в том, что в построенных правилах вывода грамматики не заложена связь между предложениями.


1. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на C++ // СПб.: Невский диалект, 1999. 721 с.
2. Луначарский А. В. Тридцать шесть сюжетов // «Театр и искусство», 1912, № 34. — См.: Луначарский А. В. О театре и драматургии. — М., 1958. — Т. II, с. 113—117.
3. Муравенко Е. | Валентности слова | Журнал «Русский язык» № 21/2009
[электронный ресурс] // URL:
http://rus.1september.ru/view_article.php?ID=200902106 (дата обращения:
23.04.2017)
4. Abbott R.J. Program Design by Informal English Descriptions // Communications of the ACM. 1983. Vol. 26, 11. P. 882-894.
5. Greek Mythology [электронный ресурс] // URL:
http://www.ilearngreek.com/mythology/greek_mythology.asp (дата обращения: 10.05.2017)
6. Harmain H.M., R. Gaizauskas. CM-Builder: An Automated NL-based CASE Tool // In Proceedings of the 15th IEEE International Conference on Automated Software Engineering (ASE'2000), 2000. P. 45-53.
7. Juristo N., Moreno A.M. How to Use Linguistic Instruments for Object- Oriented Analysis // IEEE Software, May/June 2000. Р. 80-89.
8. Kristen G. Object Orientation: The KISS-Method: From Information Architecture to Information Systems // Addison-Wesley, Reading, Mass., 1994.
9. Mich L. From Natural Language to Object Oriented Using the Natural Language Processing System LOLITA // Natural Language Engineering, 2(2), 1996. Р.161-187.
10. The Holders [электронный ресурс] // URL: http://theholders.org (дата обращения 23.05.2017)



Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ