🔍 Поиск готовых работ

🔍 Поиск работ

РАЗРАБОТКА СИСТЕМЫ АВТОМАТИЗАЦИИ ГЕНЕРАЦИИ ТЕКСТА НА КИТАЙСКОМ ЯЗЫКЕ

Работа №196507

Тип работы

Дипломные работы, ВКР

Предмет

лингвистика

Объем работы58
Год сдачи2018
Стоимость4580 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
17
Не подходит работа?

Узнай цену на написание


Введение 3
Глава 1 Текст и дискурс 5
1.1 Понятия текст и дискурс 5
1.2 Параметры и свойства текста 12
1.3 Структура дискурса 18
Выводы по главе 1 23
Глава 2 Автоматизация генерации текста 26
2.1 Уровни обработки текста 26
2.2 Этапы генерации текста 30
2.3 Модели генерации 33
Выводы по главе 2 36
Глава 3 Алгоритм генерации текста инструкций по фармацевтике на китайском языке 38
3.1 Сборка корпуса 38
3.2 Разработка алгоритма 40
3.3 Апробация прототипа 42
Выводы по главе 3 43
Заключение 45
Библиографический список 47
Приложение 52


На сегодняшний день количество информации непрерывно растет, в связи с этим повышается спрос на автоматические средства ее обработки. Становится необходимым разрабатывать системы по обработке текстов с достаточно легко формализуемой структурой, а также решать проблему автоматизации систем устного и письменного перевода для разных языков. И если вторая задача нашла свое решение, то для первой в плане китайского языка конкретного решения пока нет.
Актуальность данной работы состоит в том, что автоматические средства обработки наиболее известны для английского языка, в то время как для китайского таких средств не разработано.
Объектом дипломной работы является процесс генерации текста с использованием предикатных структур.
Предметом - автоматизация процесса генерации текста на китайском языке посредством предикатных структур.
Целью дипломной работы является разработка алгоритма генерации текста на китайском языке. Для достижения поставленной цели были выдвинуты следующие задачи:
• проанализировать уровни обработки естественного языка;
• выявить этапы и модели генерации текста;
• изучить методическую литературу по генерации текста по модели шаблонных систем;
• разработка схемы автоматизации генерации текста;
• создание базы данных, обеспечивающей наполнение схемы;
• создание прототипа системы реализующий созданный алгоритм;
• апробация прототипа
Материалом исследования послужили 10 инструкций на китайском языке по предметной области фармацевтика объемом 1713 словоупотреблений.
Теоретико-методологической базой нашей работы послужили научные труды таких ученых, как: М.В. Болдасов, Т.В. Бусел, И.Р. Гальперин, Т.А. ван Дейк, Е.С. Кубрякова, А.И. Новиков, Е.Г.Соколова, Л. Теньер, А.В. Зубов, Р. Харверг и др.
Данная работа написана в рамках корпусного подхода, в ходе которого были использованы такие методы, как: метод сплошной выборки, инструментальный, логический метод, метод моделирования, структурный метод.
Новизна данной работы состоит в том, что нами был разработан алгоритм автоматизации генерации текста на китайском языке, а также прототип на основе данного алгоритма.
Теоретическая значимость: разработанный алгоритм способствует расширению теоретической базы направления прикладной лингвистики в разделе генерация текста.
Практическая значимость: разработанный прототип может найти свое применение при построении реальных систем автоматической генерации текста-инструкций на китайском языке по фармацевтике. Данная работа может быть полезна в преподавании дисциплин по прикладной лингвистике, таких как: основы прикладной лингвистики, технология обработки текста и звучащей речи, формальные модели в лингвистике.
Структура работы: введение, три главы, заключение,
библиографический список и приложение.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В настоящей дипломной работе была рассмотрена автоматизация генерации текста на китайском языке. На сегодняшний день генерация естественного языка является динамично развивающимся направлением.
В ходе теоретической части мы разграничили понятия текст и дискурс. Системы автоматизации генерации предполагают работу непосредственно с текстом. В связи с этим обработка текста происходит на 5 уровнях: графематический, морфологический, синтаксический, семантический и дискурсивный. Также были выявлены модели генерации: шаблонные системы и лингвистически мотивированные системы.
Отличие лингвистически мотивированных систем в том, что у шаблонных систем содержимое дальнейшего текста показано в виде частей. Таким применяют готовые фразы и присоединяют готовые части текста таким образом, что они следуют строго заданным позициям. По сравнению с первой моделью лингвистически мотивированные системы способны сгенерировать текст лучшего качества, вывести его на разных языках.
Также было выявлено, что в процессе генерации информация должна пройти три этапа: макропланирование, микропланирование, языковое оформление.
В ходе выполнения практической части была выполнена поставленная цель - разработан алгоритм генерации текста на китайском языке.
Разработка алгоритма заключала в себе три этапа:
1. Поиск материала на китайском языке.
2. Разработка базы данных.
3. Создание прототипа.
Собранный корпус текстов на основе 10 инструкций на китайском языке, позволил нам провести структурный анализ, выявить схему структур предложений, предикаты и семантические падежи, которые они предполагают, а также построить базу знаний для прототипа системы автоматизации генерации текста на китайском языке.
Сгенерированный прототип предлагает пользователю выбрать предикат, а затем по желанию еще 4 компонента. При этом учтена возможность не вводить какой-либо компонент. Прототип на основе введенных данных и учтенной в системе структуры необходимого предложения, выдаст пользователю заданные компоненты на китайском языке в нужной последовательности. Также прототип системы способен помочь заполнить состав продукта.
Разработанный прототип прошел апробацию, в ходе которой была предложена еще одна инструкция, не входящая в уже собранный корпус текстов. Апробация показала, что структура предложений идентична и не допускает ошибок.
Таким образом, мы пришли к выводу, что предложенный нами прототип можно считать эффективно действующим.



1. Александрова, О. В. Виды пространств текста и дискурса /О.В. Александрова, Е.С. Кубрякова // Категоризация мира: пространство и время: материалы научной конференции / под ред. проф. Е. С. Кубряковой, проф. О. В. Александровой. - М.: Диалог-МГУ, 1997. - С. 15-25.
2. Арутюнова, Н. Д. Дискурс / Н.Д. Артюнова // Лингвистический энциклопедический словарь. - М.: Советская энциклопедия, 1990. - С. 136-137.
3. Ахманова, О.С. Словарь лингвистических терминов / О. С. Ахманова. - М.: Советская энциклопедия, 1966. - 108 с.
4. Бабенко, Л.Г. Лингвистический анализ художественного текста. Теория и практика [Текст] : учебник / Л.Г. Бабенко, Ю.В. Казарин. - М. : Флинта : Наука, 2008. - 534 с.
5. Болдасов, М.В. Парадигмы генерации ЕЯ текстов в инструментальной среде DEMLING /М.В. Болдасов // Труды международной конференции Диалог 2003 по компьютерной лингвистике и интеллектуальным технологиям. - Протвино, 2003. - С. 66-75.
6. Болдасов, М.В. Генерация текстов на естественном языке - теории, методы, технологии / М. В. Болдасов, Е. Г. Соколова // НТИ. Сер. 2. Информационные процессы и системы. - 2006. - № 2. - С. 1-14.
7. Болотнова, Н. С. Филологический анализ текста / Н. С. Болотнова. - 4-е изд. - М. : Флинта : Наука, 2009. - 520 с.
8. Бусел, Т.В. О лингвистически мотивированных подходах к проблеме генерации текстов на естественном языке / Т. В. Бусел. - Вестн. МГЛУ. Сер.1 Филология. - 2009. - № 2. - С. 170-178.
9. Валгина, Н.С. Теория текста : учеб. пособие / Н. С. Валгина. - М.: Логос, 2003. - 280 с.
10. Вишнякова, О.Д. Язык и концептуальное пространство (на материале
современного английского языка) / О. Д. Вишнякова. - М.: МАКС
Пресс, 2002. - 380 с.
11. Выготский, Л. С. Мышление и речь / Л. С. Выготский. - Изд. 5, испр.
- М.: Издательство «Лабиринт», 1999. - 352 с.
12. Гальперин, И.Р. Текст как объект лингвистического исследования / И. Р. Гальперин. - М.: Наука, 1981. - 139 с.
13. Гаузенблас, К. О характеристике и классификации речевых произведений / О. Гаузенблас // Новое в зарубежной лингвистике. Вып. 8: Лингвистика текста. - М.: Наука, 1978. - С. 57-78.
14. Греймас, А. Семиотика. Объяснительный словарь теории языка /
А. Греймас, Ж. Курте. - М.: Радуга, 1983. - С. 483-550.
15. Грицанов, А.А. Новейший философский словарь / сост. и гл. н. ред. А. А. Грицанов. - 3-е изд., испр. - Мн.: Книжный Дом, 2003. - 1280 с...49



Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ