Тип работы:
Предмет:
Язык работы:


Разработка системы визуализации результата лингвистического анализа

Работа №41763

Тип работы

Дипломные работы, ВКР

Предмет

лингвистика

Объем работы87
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
241
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ............................................................................................................. 5
Глава I. АНАЛИТИЧЕСКИЙ ОБЗОР ТЕХНОЛОГИЙ ВИЗУАЛИЗАЦИИ .... 7
1.1 Компьютерная лингвистика как наука и этапы ее развития .................... 7
1.2 Аппаратное и программное обеспечение информационных технологий
в лингвистике .................................................................................................... 12
1.3 Лингвистические компоненты автоматического анализа текста .......... 14
1.4 Автоматическое распознавание текста..................................................... 17
1.5 Задачи извлечения информации из текста, извлечение знаний............. 19
1.6 Системы, моделирующие языковое взаимодействие ............................. 21
1.7 Метод визуализации в процессе компьютерного моделирования ........ 23
1.8 Примеры методов визуализации ............................................................... 27
1.10 Проект Диалинг......................................................................................... 38
Глава II.РЕЗУЛЬТАТЫ СОБСТВЕННЫХ ИССЛЕДОВАНИЙ...................... 40
2.1 Описание и цель иследования. .................................................................. 40
2.2. Руководство использования...................................................................... 42
2.3 Пример работы............................................................................................ 43
2.4 Визуализация ассоциаций термина........................................................... 48
2.5 Визуализация общих категорий тега опросчика и категорий документа
............................................................................................................................. 51
2.6 Понимание масштабированного F-Score.................................................. 553
2.7 Анализ Emoji. .............................................................................................. 67
ЗАКЛЮЧЕНИЕ .................................................................................................... 72
Используемые модели и технологии ................................................................. 73
ЛИТЕРАТУРА...................................................................................................... 76
Приложение

Роль процессов, связанных с содержательной обработкой информации,
несомненно, является в нынешнюю эпоху тотальной информатизации наиболее
определяющим звеном научно-технического прогресса.
Основная часть ранних работ в области представления знаний, то есть науки
о том, как преобразовать знания в такую форму, с которой может легко оперировать
компьютер, была привязана к языку и подпитывалась исследованиями в области
лингвистики, которые, в свою очередь, основывались на результатах философского
анализа языка, проводившегося в течение многих десятилетий. Таким образом,
современная лингвистика и бурно развивающаяся наука по созданию
искусственного интеллекта, зародившиеся в середине ХХ века, продолжают расти
вместе, пересекаясь в гибридной области, которая и называется обработкой
естественного языка или компьютерной лингвистикой. Любые значимые успехи,
получаемые ныне исследователями в этой области, являются основой успешного
научно-технического и экономического развития как частных фирм, так и на уровне
государств. Поэтому исследования и разработки в области автоматической
обработки текста в Европе и США привлекают внимание крупнейших частных
фирм и государственных организаций самого высокого уровня. Европейский союз
уже несколько лет координирует различные программы в области автоматической
обработки текста. Например, Human Language Technology Sector of the Information
Society Technologies (IST) Programme 1998 - 2000. Один из наиболее интересных
проектов в рамках данной программы - SPARKLE (Shallow PARsing and Knowledge
Extraction for Language Engineering), в число участников которого входят такие
всемирно известные концерны, фирмы и организации, как Daimler-Benz, Xerox
Research Centre in Europe и Cambridge University Computer Laboratory. Цель проекта6
- создание частичных синтаксических анализаторов для основных языков
Европейского союза.
В США с 1991 до осени 1998 года существовал проект TIPSTER,
организованный Департаментом Обороны и ЦРУ совместно с Национальным
Институтом Стандартов и Технологий и Центром военно-воздушных и военноморских вооружений (SPAWAR). В работе консультативного совета программы
участвовали также ФБР, Национальный Научный Фонд и некоторые другие
организации. Основной целью программы было сравнение и оценка результатов
работы различных поисковых систем и систем реферирования [22].
Целью работы является разработка системы визуализации результатов
лингвистического анализа.
Для достижения указанной цели в работе решаются следующие задачи:
1. Классификация результатов лингвистического анализа
2. Классификация типов визуализации лингвистической информации
3. Анализ систем визуализации результатов лингвистического анализа
4. Анализ технологий, позволяющих производить визуализацию
5. Реализация системы визуализации результатов лингвистического анализа
Методами исследования являются:
1. Анализ;
2. Синтез;
3. Классификация;
4. Моделирование;
5. Структурно-функциональный

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В настоящей выпускной квалификационной работе был проведен анализ
работы систем визуализации результатов лингвистического анализа и уровень
развития современных технологий, в ходе которого выяснилась необходимость
оптимизации системы визуализации. Для оптимизации была разработана
программа «scattertext». Далее она был реализована с помощью такого языка
программирования, как Python. С помощью CSS и HTML был создан и реализован
способ визуализации полученного результата программой «scattertext». В ходе
выполнения работы проведён поиск достаточно эффективных авторских подходов
к реализации задачи визуализации результатов анализа текстов на естественном
языке. Эти подходы могут быть применены разработчиками компьютернолингвистических систем автоматизированного анализа текстов. Таким образом, все
поставленные цели были достигнуты, задачи – выполнены, необходимые функции
– реализованы.


Авербух, В.Л. Использование трехмерных метафор визуализации.
/В.Л.Авербух, А.Ю. Байдалин, Д.Р. Исмагилов, А.Ю. Казанцев, С.П.
Тимошпольский.- М.: International Conference Graphicon, 2004.
2. Авербух, В.Л. К теории компьютерной визуализации / В.Л. Авербух.- М.:
Вычислительные технологии, 2005.- Том 10, № 4.- C.21-51.
3. Баранов, А.Н. Введение в прикладную лингвистику / А.Н. Баранов.- М.:
Эдиториал УРСС, 2001.- 360 с.
4. Бахшиев, А. Круг жизни: Противостояние / А. Бахшиев.- 1999.
5. Бектаев, К.Б. Математические методы в языкознании: учебное пособие: в
2 частях / К.Б. Бектаев, Р.Г. Пиотровский. – Алма-Ата: КазГУ, 1974. – ч. II.
Математическая статистика и моделирование языка. – 334 с.
6. Биркгофф, Г. Математика и психология/ Биркгофф Г.- Советское радио,
1977.-96 c.
7. Блох, Дж. Java. Эффективное программирование/ Дж. Блох - М.: Лори,
2002.– 224 с.
8. Брукс, Ф. Мифический человеко-месяц или как создаются программные
системы: Пер. с англ. / Ф.Брукс - СПб.: Символ-Плюс., 1999. – 304 с.
9. Булич, С.К. Семасиология / С.К. Булич // Энциклопедический словарь77
Брокгауза и Ефрона: В 86 томах (82 т. и 4 доп.). - СПб.: 1890-1907.
10. Вагин, В.Н. Достоверный и правдоподобный вывод в интеллектуальных
системах / В.Н. Вагин.- Изд-во: ФМЛ.- 2004.- 704 с.
11. Дуда, Р. Распознавание образов и анализ сцен/ Р. Дуда, П. Харт.- Мир,
1976.- 507с.
12. Дунаев, С. Java для Internet в Windows и Linux/ С. Дунаев.- М.: ДИАЛОГМИФИ, 2004.– 496 с.
13. Емельянов, В.В. Теория и практика эволюционного моделирования/ В.В.
Емельянов, В.В. Курейчик, В.М. Курейчик.- Изд-во: ФМЛ, 2003.- 432 с.
14. Замятин, А.П. Языки, грамматики, распознаватели/ А.П. Замятин, А.М.
Шур.- Екатеринбург: Изд-во Урал. ун-та, 2007.- 248 с.
15. Коваль, С.А. Лингвистические проблемы компьютерной морфологии /
С.А. Коваль.- СПб.: Изд-во С.-Петерб. ун-та, 2005.- 151 с.
16. Козеренко, Е.Б. Эволюция лингво-семантических представлений в
интеллектуальных системах на основе расширенных семантических
сетей/Е.Б. Козеренко, И.П. Кузнецов // Труды международной
конференции «Диалог 2010».- М.: Институт проблем информатики РАН,
26 мая 2010
17. Лахути, Д.Г. Разработка средств автоматического синтаксического
анализа как модуля системы понимания текста / Д.Г. Лахути, А.М.
Баталина, М.Е. Епифанов.- 26 марта 2009 г.
18. Лезин, Г.В. Об автоматическом выявлении референциальной связности78
повествовательного текста, Санкт - Петербургский экономикоматематический институт РАН 2010 [Электронный ресурс] Режим
доступа: / dialog2006/materials/html/Lezin.htm.
19. Леонтьева, А. Автоматический синтаксический анализ русских текстов/
А. Леонтьева, И. Кагиров // Санкт-Петербургский институт информатики
и автоматизации РАН.- Труды 10-й Всероссийской научной конференции
«Электронные библиотеки: перспективные методы и технологии,
электронные коллекции» – RCDL’2008, Дубна, Россия, 2008.- с. 397-400.
20. Логическое программирование: сборник статей / Под ред. Агафонова
В.Н.- МИР, 1988.- 367 с.
21. Мартыненко, Г.Я. Некоторые статистические закономерности
концентрации и рассеяния элементов в лингвистических и других
сложных системах // Структурная и прикладная лингвистика.- Вып. 1,
Изд-во ЛГУ, 1978.– С. 63-79.
22. Марчук Ю.Н. Основы компьютерной лингвистики: Учебное пособие/
Ю.Н. Марчук.- М., 1999. - 225 с.
23. Михаилян А. Некоторые методы автоматического анализа естественного
языка, используемые в промышленных продуктах / А. Михаилян.- 2001.
24. Новое в зарубежной лингвистике: Вып. XXIV/ Компьютерная
лингвистика: Пер. с англ.; сост., ред. и вступ. ст. Б.Ю. Городецкого.- М.:
Прогресс, 1989.- 432 c.79
25. Ножов, И.М. Морфологическая и синтаксическая обработка текста
(модели и программы)/ И.М. Ножов // Дис. ... канд. техн. наук. – М., 2003.
26. Поспелов, Д.А. Искусственный интеллект: Справочник (Книга 2. Модели
и методы) / Д.А. Поспелов.- 1990.- 304 с.
27. Самарский, А.А. Математическое моделирование и вычислительный
эксперимент / А.А. Самарский // Вест. АН СССР.- 1979.- № 5.- C.38–49.
28. Семантика // Лингвистический энциклопедический словарь: под. ред. В.Н.
Ярцева - 1990.- C. 688.
28. Смолин, Д.В. Введение в искусственный интеллект: конспект лекций/
Смолин Д.В.- Изд-во: ФМЛ, 2004.- 208 с.
29. Сокирко, А.В. Морфологические модули на сайте / А.В. Сокирко //
Компьютерная лингвистика и интеллектуальные технологии. Труды
международной конференции «Диалог 2004». «Верхневолжский», 2004.–
C. 559-564.
30. Фурман, Я.А. Комплекснозначные и гиперкомплексные системы в задачах
обработки многомерных сигналов/ Я.А. Фурман - Изд-во: ФМЛ, 2004.-
456 с.
31. Хорошевский, В.Ф. Оценка систем извлечения информации из текстов на
естественном языке: кто виноват, что делать / В.Ф. Хорошевский //
Десятая национальная конференция по искусственному интеллекту с
международным участием (КИИ-2006). г. Обнинск, 2006.– C. 464-478.

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ