Тема: Создание многоуровневого открытого набора связанных данных на основе словарных ресурсов для русского языка
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 4
1. Основные технологии связывания открытых лингвистических
данных 6
1.1 Semantic Web 6
1.2 Открытые связанные лингвистические данные (LLOD) 7
1.2.1 Связанные данные 9
1.2 Архитектура Semantic Web 11
1.2.1 Unicode и Унифицированный индикатор ресурса URI 12
1.2.2 Расширяемый язык разметки 13
1.2.3 Структура описания ресурсов RDF 13
1.2.3 Схема структуры описания ресурсов 14
1.2.5 Язык веб онтологии OWL 16
1.2.6 SPARQL 17
1.2.7 Верхний слой «Пользовательский интерфейс и приложение». 17
1.3 Используемые онтологии 18
1.3.1. Структура ядра онтологии Lemon 19
1.3.2. Возможности Lemon 20
2. Разработка RDF связанного лингвистического ресурса 21
2.1 Определение состава нового лингвистического ресурса 23
2.1.1 Тезаурус Рутез 23
2.1.2 Грамматический словарь 24
2.2 Разработка архитектуры многоуровневого лингвистического ресурса.. 24
2.3 Разработка алгоритмов импорта данных из исходных тезаурусов и
словарей 25
2.4 Представление данных в виде модели Linguistic Linked Open Data 29
2.5 Разработка алгоритмов связывания данных на различных уровнях
представления 34
2.6 Разработка алгоритмов конвертации полученных связанных данных в
ресурс на основе моделей онтологий Lemon, Lexlnfo и SKOS 36
3. RDF набор многоуровневого лингвистического ресурса 39
4. Числовые оценки 41
5. Варианты использования 43
Заключение 44
Список использованных источников
Листинг
📖 Введение
Актуальность работы определяется еще и тем, что в настоящее время лингвистические ресурсы для распространенных европейских и восточных языков уже опубликованы, но для русского языка и для языков народов России практически не представлены.
Основная цель данной работы - разработать связанный лингвистический многоуровневый ресурс на основе русскоязычного тезауруса и словарей, на основе существующих и специально разработанных семантических моделей и онтологий.
Для достижения поставленной цели на необходимо решить следующие задачи:
• Определить состав нового лингвистического ресурса.
• Разработать представление многоуровневой архитектуры ресурса.
• Разработать алгоритмы импорта данных из исходных тезаурусов и словарей.
Представить данные в виде модели Linguistic Linked Open Data (LLOD).
Разработать алгоритмы связывания данных на различных уровнях представления (связи лексического, морфологического и семантического уровней)
Разработать алгоритмы конвертации полученных связанных данных в ресурс на основе моделей онтологий Lemon, Lexlnfo и SKOS. Опубликовать новый лингвистический ресурс в облаке LLOD.
✅ Заключение
В ближайшее время будет опубликован полученный ресурс в домене LLOD по ссылке http://lod.ruthes.org.
Дальнейшие развитие построенного ресурса будет направлено на связывание полученного ресурса с ресурсами других языков таких, как татарский, а также ряда европейских языков. Дополнительно планируется расширение функционала приложения и пополнение базы знаний ресурса данными из других источников.



