Тип работы:
Предмет:
Язык работы:


Создание многоуровневого открытого набора связанных данных на основе словарных ресурсов для русского языка

Работа №77793

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы76
Год сдачи2017
Стоимость4270 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
40
Не подходит работа?

Узнай цену на написание


Содержание 2
Введение 4
1. Основные технологии связывания открытых лингвистических
данных 6
1.1 Semantic Web 6
1.2 Открытые связанные лингвистические данные (LLOD) 7
1.2.1 Связанные данные 9
1.2 Архитектура Semantic Web 11
1.2.1 Unicode и Унифицированный индикатор ресурса URI 12
1.2.2 Расширяемый язык разметки 13
1.2.3 Структура описания ресурсов RDF 13
1.2.3 Схема структуры описания ресурсов 14
1.2.5 Язык веб онтологии OWL 16
1.2.6 SPARQL 17
1.2.7 Верхний слой «Пользовательский интерфейс и приложение». 17
1.3 Используемые онтологии 18
1.3.1. Структура ядра онтологии Lemon 19
1.3.2. Возможности Lemon 20
2. Разработка RDF связанного лингвистического ресурса 21
2.1 Определение состава нового лингвистического ресурса 23
2.1.1 Тезаурус Рутез 23
2.1.2 Грамматический словарь 24
2.2 Разработка архитектуры многоуровневого лингвистического ресурса.. 24
2.3 Разработка алгоритмов импорта данных из исходных тезаурусов и
словарей 25
2.4 Представление данных в виде модели Linguistic Linked Open Data 29
2.5 Разработка алгоритмов связывания данных на различных уровнях
представления 34
2.6 Разработка алгоритмов конвертации полученных связанных данных в
ресурс на основе моделей онтологий Lemon, Lexlnfo и SKOS 36
3. RDF набор многоуровневого лингвистического ресурса 39
4. Числовые оценки 41
5. Варианты использования 43
Заключение 44
Список использованных источников
Листинг

Первые опыты публикации таких ресурсов в виде открытых связанных данных предпринимались с момента появления технологий Semantic Web в начале 2000-х. Только за последние пять лет появился большой интерес среди разработчиков и исследователей в области обработки естественного языка к созданию собственных ресурсов и приложений с использованием высококачественных словарей, тезаурусов, корпусов и др. Одна из главных проблем заключается в том, что опубликованные открытые данные хранятся в разных форматах, что затрудняет эффективное использование этих данных, поэтому актуальна разработка связанного лингвистического ресурса, который был бы спроектирован на общепринятых стандартах.
Актуальность работы определяется еще и тем, что в настоящее время лингвистические ресурсы для распространенных европейских и восточных языков уже опубликованы, но для русского языка и для языков народов России практически не представлены.
Основная цель данной работы - разработать связанный лингвистический многоуровневый ресурс на основе русскоязычного тезауруса и словарей, на основе существующих и специально разработанных семантических моделей и онтологий.
Для достижения поставленной цели на необходимо решить следующие задачи:
• Определить состав нового лингвистического ресурса.
• Разработать представление многоуровневой архитектуры ресурса.
• Разработать алгоритмы импорта данных из исходных тезаурусов и словарей.
Представить данные в виде модели Linguistic Linked Open Data (LLOD).
Разработать алгоритмы связывания данных на различных уровнях представления (связи лексического, морфологического и семантического уровней)
Разработать алгоритмы конвертации полученных связанных данных в ресурс на основе моделей онтологий Lemon, Lexlnfo и SKOS. Опубликовать новый лингвистический ресурс в облаке LLOD.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В выпускной квалификационной работ впервые для русского языка на основе тезауруса Рутез и Грамматического словаря разработан связанный многоуровневый лингвистический ресурс и консольное приложение, реализующий модель данных LLOD на основе онтологий Lemon, SKOS, Lexlnfo.
В ближайшее время будет опубликован полученный ресурс в домене LLOD по ссылке http://lod.ruthes.org.
Дальнейшие развитие построенного ресурса будет направлено на связывание полученного ресурса с ресурсами других языков таких, как татарский, а также ряда европейских языков. Дополнительно планируется расширение функционала приложения и пополнение базы знаний ресурса данными из других источников.



1. John McCrae, Dennis Spohr, Philipp Cimiano. Linking Lexical Resources and Ontologies on the Semantic Web with Lemon // 8th Extended Semantic Web Conference (ESWC 2011)
2. O. Nevzorova, N. Zhiltsov, A. Kirillovich, E. Lipachev. OntoMathPro Ontology: A Linked Data Hub for Mathematics H Knowledge Engineering and the Semantic Web. 5th International Conference, Proceedings. — Communications in Computer and Information Science, Vol. 468 — Springer International Publishing — 2014 — pp, 105-119
3. Semantic Web - W3C [Электронный ресурс]. - Режим доступа URL: http://www.w3.orgJstandards/semanticweb/. - W3C (дата обращения: 01.06.2017).
4. Introduction The Semantic Web, Web 3.0, the Linked Data Web, the Web of Data [Электронный ресурс]. - Режим доступа URL: http: ./www.cambridgesemantics.com/semantic-university/introduction- semantic-web. - Cambridge Semantics (дата обращения: 19.06.2017).
5. LLOD Cloud | Linguistic Linked Open Data [Электронный ресурс]. - Режим доступа URL: http:/ linguistic-lod.org/llod-cloud. - Linguistic Linked Open Data Cloud (дата обращения: 01.06.2017).
6. Christian Chiarcos, et al. Towards Open Data for Linguistics: Linguistic Linked Data // New Trends of Research in Ontologies and Lexical Resources. Springer, 2013
7. John Philip McCrae, et al. The Open Linguistics Working Group: Developing the Linguistic Linked Open Data Cloud // 10th International Conference on Language Resources and Evaluation (LREC 2016)
8. About | DBpedia [Электронный ресурс]. - Режим доступа URL: http://wiki.dbpedia.org/about. - DBpedia (дата обращения: 01.06.2017).
9. Tim Bemers-Lee Linked Data - Design Issues [Электронный ресурс]. - Режим доступа URL: https://www.w3.org/DesignIssues/LinkedData.html. (дата обращения: 19.06.2017).
10. Christian Chiarcos, et al. Towards Open Data for Linguistics: Linguistic Linked Data H New Trends of Research in Ontologies and Lexical Resources. Springer, 2013.
11.Introduction to ontologies and semantic web - tutorial - Semantic Web Architecture [Электронный ресурс]. - Режим доступа URL: https://www.w3.org/DesignIssues/LinkedData.htmL- Semantic Web Architecture (дата обращения: 19.06.2017).
12. Extensible Markup Language (XML) [Электронный ресурс]. - Режим доступа URL: http://www.w3.org/XMLL- W3C (дата обращения: 19.06.2017).
13. Resource Description Framework (RDF) [Электронный ресурс]. - Режим доступа URL: http://www.w3.org/RDF/. - W3C (дата обращения: 19.06.2017).
14. Web Ontology Language (OWL) [Электронный ресурс]. - Режим доступа URL: https:/ www.w3 .org/2001 /sw. wiki/OWL. - W3C (дата обращения: 19.06.2017).
15.SPARQL Query Language for RDF [Электронный ресурс]. - Режим доступа URL: http;//www.w3.ortL'TR rdf-sparql-query/. - W3C (дата
обращения: 19.06.2017).
16.SKOS Simple Knowledge Organization System Primer [Электронный ресурс]. - Режим доступа URL: http://www.w3.org.TR/skos-reference/. - W3C Working Group Note 18 August 2009 (дата обращения: 01.06.2017).
17. The lemon cookbook [Электронный ресурс]. - Режим доступа URL: http://lemon-model.net/lemon-cookbook.pdf. - John McCrae, Guadalupe Aguado-de-Cea, Paul Buitelaar, Philipp Cimiano, Thierry Declerck, Asuncion Gomez Perez, Jorge Gracia, Laura Hollink, Elena Montiel- Ponsoda, Dennis Spohr and Tobias Wunner (дата обращения: 14.06.2017).
18. Ustalov D.: Russian Thesauri as Linked Open Data. In: Computational Linguistics and Intellectual Technologies: papers from the Annual conference “Dialogue”. Volume 1. RGGU, Moscow (2015) 616-625
19. Christian Chiarcos. OLiA - Ontologies of Linguistic Annotation // Semantic Web, Volume 6, Number 4, 2015. Pp. 379-386
20. Лукашевич H.B., Добров Б.В., Четверкин И.И., Рутез-Lite, опубликованная версия тезауруса русского языка Рутез // Международная конференция по компьютерной лингвистике и интеллектуальным технологиям Диалог'2014.
2LLoukachevitch N. Thesauri in information-retrieval tasks, Moscow 11 Moscow (2011) University publishing house .


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ