МОДЕЛИРОВАНИЕ СТРУКТУРЫ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ «ФИЛОСОФСКАЯ ПРАКТИКА» (НА МАТЕРИАЛЕ КОРПУСА НАУЧНЫХ ТЕКСТОВ НА РУССКОМ ЯЗЫКЕ)
|
Введение 3
Глава 1 Моделирование онтологий 7
1.1. Трактовки понятия «онтология»: 7
1.2. Структура отологии 8
1.3. Классификация онтологий 9
1.3.1. Классификация по цели создания онтологии 10
1.3.2. Классификация по наполнению 11
1.3.3. Классификация по формальности 12
1.4. Онтология предметных областей и лингвистическая онтология 13
1.5. Разработка модели структуры онтологии предметной области 15
1.5.1. Основные аспекты разработки онтологий 15
1.5.2. Определение множества отношений 17
1.5.2.1. Родовидовые отношения и отношения несовместимости 18
1.5.2.2. Каузативные отношения 19
1.5.2.3. Падежная грамматика Ч. Филлмора и референциально -
ролевая и номинативная грамматика Р. Ван Валина 22
Выводы по главе 1 25
Глава 2 Модель структуры онтологии предметной области «Философская практика»: корпусный подход 27
2.1. Определение множества концептов и соотнесение лексических
единиц с концептами онтологии 27
2.2. Определение множества отношений и установление связей между
концептами 32
Выводы по главе 2 43
Заключение 46
Библиографический список 48
Глава 1 Моделирование онтологий 7
1.1. Трактовки понятия «онтология»: 7
1.2. Структура отологии 8
1.3. Классификация онтологий 9
1.3.1. Классификация по цели создания онтологии 10
1.3.2. Классификация по наполнению 11
1.3.3. Классификация по формальности 12
1.4. Онтология предметных областей и лингвистическая онтология 13
1.5. Разработка модели структуры онтологии предметной области 15
1.5.1. Основные аспекты разработки онтологий 15
1.5.2. Определение множества отношений 17
1.5.2.1. Родовидовые отношения и отношения несовместимости 18
1.5.2.2. Каузативные отношения 19
1.5.2.3. Падежная грамматика Ч. Филлмора и референциально -
ролевая и номинативная грамматика Р. Ван Валина 22
Выводы по главе 1 25
Глава 2 Модель структуры онтологии предметной области «Философская практика»: корпусный подход 27
2.1. Определение множества концептов и соотнесение лексических
единиц с концептами онтологии 27
2.2. Определение множества отношений и установление связей между
концептами 32
Выводы по главе 2 43
Заключение 46
Библиографический список 48
На пути к онтологической парадигме история демонстрирует знаменательные вехи. Попытки, и небезуспешные, подобраться вплотную к сущности языка с онтологических позиций предпринимались со времен античности. В прикладной лингвистике интерес к изучению онтологий существует на протяжении трех десятилетий. Понимание естественного языка компьютерными системами обеспечивают онтологические модели, в результате чего в большом количестве практических задач, к числу которых относится извлечение информации из текстов, семантическое аннотирование, разрешение лексической многозначности, машинный перевод, и т. д., такие модели находят применение.
Актуальность исследования обусловлена двумя факторами:
• во-первых, в современном мире онтологии используются в ряде задач, связанных с обработкой естественного языка.
• во-вторых, философская практика постепенно становится признанной профессией, созданы ассоциации представителей этой профессии во многих странах, увеличивается количество клиентов, пользующихся услугами практикующих философов, но с лингвистической точки зрения, данная область мало изучена.
Объектом исследования являются концепты (понятия) предметной области «философская практика» и лексические единицы, отображаемые на определенных концептах онтологии.
Предметом исследования является моделирование структуры онтологии предметной области в терминах концептов и отношений между ними.
Цель данного исследования заключается в том, чтобы построить модель структуры онтологии предметной области «Философская практика» на основе исследования корпусов научных текстов на русском языке, которая может быть использована в различных задачах обработки естественного языка.
Для достижения поставленной цели исследования были определены следующие задачи:
1) изучить источники по проблеме;
2) рассмотреть теоретические аспекты, связанные с разработкой онтологий: определить понятие онтологии, проанализировать различные классификации онтологических ресурсов;
3) собрать корпус текстов, принадлежащих предметной области и извлечь значимые для предметной области слова и словосочетания с помощью автоматизированных процедур;
4) определить перечень концептов предметной области «Философская практика»;
5) соотнести данные слова/словосочетания с концептами и установить связи;
Использованные в работе методы научного исследования обусловлены поставленными задачами. В частности, были применены следующие методы:
1) сплошной выборки;
2) описательный, с использованием приемов наблюдения и обобщения проанализированного материала;
3) дефиниционного анализа;
4) частотно-дистрибутивного анализа;
5) онтологического анализа;
6) моделирования;
Теоретико-методологической базой исследования являются: работы о теоретических аспектах разработки онтологий отечественных (О. А. Митрофанова, В. Д. Соловьев, Н. В. Лукашевич, С.О. Шереметьева и др.) и зарубежных (Т. Грубер, Р. Ван Валин, Ч. Филлмор, и др.) авторов;
В качестве материала исследования использован корпус научных текстов предметной области «Философская практика», собранный из:
• Краткого словаря-презентации «Язык философской практики» (под ред. С.В. Борисова);
• 4-ой лекции «Введение в философскую антропологию» (Автор С. В. Борисов);
• 3-ей главы «Философская практика» (под ред. Е.В. Гредновской).
Объем корпуса для отбора частотных лексических единиц равен 67165 словоупотреблению, объем подкорпуса для вычленения отношений между концептами - 24442 словоупотребления.
Научная новизна исследования состоит в том, что в нем впервые разработана модель структуры онтологии предметной области «философская практика» для описания значений лексических единиц русского языка, разработана методика определения концептуальной структуры предметной области, выявлено специфичное распределение концептов в пределах конкретной узкой предметной области, определены отношения между концептами: родовидовые отношения, каузальные отношения, отношения несовместимости и отношения через семантические роли, посредством соотнесения теорий Ч.Филлмора и Р. Ван Валина воедино.
Теоретическая значимость исследования обусловлена тем, что разработанная методика способствует расширению теории онтологического анализа, теории автоматической обработки текстов, теории семантических сетей (системы представления знаний).
Практическая ценность исследования состоит в том, разработанную модель структуры онтологии предметной области можно применять в системах автоматической обработки текстов и в преподавании таких учебных дисциплин, как «Общая и компьютерная лексикография», «Корпусная лингвистика», «Технологии обработки текста и звучащей речи» и «Формальные модели в лингвистике».
Апробация работы была проведена на конкурсе научно¬исследовательских работ студентов в 2019-2020 учебном году, ежегодной вузовской 73-ей студенческой конференции, межвузовской студенческой научно-практической конференции «Актуальные проблемы в науке: взгляд молодых» 2020 г. По материалам работы было написано три статьи:
1. Моделирование структуры онтологии предметной области «Философская практика» на основе исследование корпуса научных текстов на русском языке.
2. Вариативность лексической реализации концептов онтологии предметной области «Философская практика»: корпусное исследование на материале научных текстов на русском языке.
3. Моделирование структуры онтологии предметной области «Философская практика»: корпусное исследование.
Во введении дается обоснование актуальности и выбора темы исследования, определяются объект, предмет, цель, задачи и методы исследования, а также научная новизна, теоретическая значимость и практическая значимость.
Основная часть исследования представлена двумя главами и посвящена последовательному решению поставленных задач.
Первая глава состоит из пяти параграфов и посвящена анализу теоретических аспектов, связанных с изучением и разработкой модели структуры онтологии предметной области.
Во второй главе приводится методика практического исследования, описывается его ход и результаты.
В заключении приводятся основные итоги проведенного исследования, формулируются общие выводы.
Актуальность исследования обусловлена двумя факторами:
• во-первых, в современном мире онтологии используются в ряде задач, связанных с обработкой естественного языка.
• во-вторых, философская практика постепенно становится признанной профессией, созданы ассоциации представителей этой профессии во многих странах, увеличивается количество клиентов, пользующихся услугами практикующих философов, но с лингвистической точки зрения, данная область мало изучена.
Объектом исследования являются концепты (понятия) предметной области «философская практика» и лексические единицы, отображаемые на определенных концептах онтологии.
Предметом исследования является моделирование структуры онтологии предметной области в терминах концептов и отношений между ними.
Цель данного исследования заключается в том, чтобы построить модель структуры онтологии предметной области «Философская практика» на основе исследования корпусов научных текстов на русском языке, которая может быть использована в различных задачах обработки естественного языка.
Для достижения поставленной цели исследования были определены следующие задачи:
1) изучить источники по проблеме;
2) рассмотреть теоретические аспекты, связанные с разработкой онтологий: определить понятие онтологии, проанализировать различные классификации онтологических ресурсов;
3) собрать корпус текстов, принадлежащих предметной области и извлечь значимые для предметной области слова и словосочетания с помощью автоматизированных процедур;
4) определить перечень концептов предметной области «Философская практика»;
5) соотнести данные слова/словосочетания с концептами и установить связи;
Использованные в работе методы научного исследования обусловлены поставленными задачами. В частности, были применены следующие методы:
1) сплошной выборки;
2) описательный, с использованием приемов наблюдения и обобщения проанализированного материала;
3) дефиниционного анализа;
4) частотно-дистрибутивного анализа;
5) онтологического анализа;
6) моделирования;
Теоретико-методологической базой исследования являются: работы о теоретических аспектах разработки онтологий отечественных (О. А. Митрофанова, В. Д. Соловьев, Н. В. Лукашевич, С.О. Шереметьева и др.) и зарубежных (Т. Грубер, Р. Ван Валин, Ч. Филлмор, и др.) авторов;
В качестве материала исследования использован корпус научных текстов предметной области «Философская практика», собранный из:
• Краткого словаря-презентации «Язык философской практики» (под ред. С.В. Борисова);
• 4-ой лекции «Введение в философскую антропологию» (Автор С. В. Борисов);
• 3-ей главы «Философская практика» (под ред. Е.В. Гредновской).
Объем корпуса для отбора частотных лексических единиц равен 67165 словоупотреблению, объем подкорпуса для вычленения отношений между концептами - 24442 словоупотребления.
Научная новизна исследования состоит в том, что в нем впервые разработана модель структуры онтологии предметной области «философская практика» для описания значений лексических единиц русского языка, разработана методика определения концептуальной структуры предметной области, выявлено специфичное распределение концептов в пределах конкретной узкой предметной области, определены отношения между концептами: родовидовые отношения, каузальные отношения, отношения несовместимости и отношения через семантические роли, посредством соотнесения теорий Ч.Филлмора и Р. Ван Валина воедино.
Теоретическая значимость исследования обусловлена тем, что разработанная методика способствует расширению теории онтологического анализа, теории автоматической обработки текстов, теории семантических сетей (системы представления знаний).
Практическая ценность исследования состоит в том, разработанную модель структуры онтологии предметной области можно применять в системах автоматической обработки текстов и в преподавании таких учебных дисциплин, как «Общая и компьютерная лексикография», «Корпусная лингвистика», «Технологии обработки текста и звучащей речи» и «Формальные модели в лингвистике».
Апробация работы была проведена на конкурсе научно¬исследовательских работ студентов в 2019-2020 учебном году, ежегодной вузовской 73-ей студенческой конференции, межвузовской студенческой научно-практической конференции «Актуальные проблемы в науке: взгляд молодых» 2020 г. По материалам работы было написано три статьи:
1. Моделирование структуры онтологии предметной области «Философская практика» на основе исследование корпуса научных текстов на русском языке.
2. Вариативность лексической реализации концептов онтологии предметной области «Философская практика»: корпусное исследование на материале научных текстов на русском языке.
3. Моделирование структуры онтологии предметной области «Философская практика»: корпусное исследование.
Во введении дается обоснование актуальности и выбора темы исследования, определяются объект, предмет, цель, задачи и методы исследования, а также научная новизна, теоретическая значимость и практическая значимость.
Основная часть исследования представлена двумя главами и посвящена последовательному решению поставленных задач.
Первая глава состоит из пяти параграфов и посвящена анализу теоретических аспектов, связанных с изучением и разработкой модели структуры онтологии предметной области.
Во второй главе приводится методика практического исследования, описывается его ход и результаты.
В заключении приводятся основные итоги проведенного исследования, формулируются общие выводы.
Онтологические модели, или онтологии, играют важную роль в инженерии знаний и, в частности, в прикладной лингвистике. Они обеспечивают своего рода понимание компьютерными системами текста на естественном языке, ввиду чего используются в ряде задач, связанных с автоматической обработкой текста.
Для достижения цели исследования было поставлено несколько задач, первой из которых стало раскрытие теоретического аспекта онтологии как модели представления знаний. Онтология - это независимая от естественного языка структура, описывающая предметы и явления реальной действительности в их восприятии человеком, создаваемая для решения определенной задачи. Существует множество классификаций онтологий, однако основным типом считается онтология предметной области.
В качестве материала исследования был использован научный корпус текстов, содержащий труды ученых по предметной области на русском языке. Объем корпуса для отбора частотных лексических единиц составил 67165 тыс. словоупотреблений, подкорпуса для вычленения отношений между концептами - 24 422 словоупотребления.
Результаты, полученные в ходе проведения исследования, позволили сформулировать следующие выводы:
1. На основе анализа для предметной области «Философская практика» характерна модель структуры, включающая 13 концептов.
2. На основе анализа для предметной области «Философская практика» характерна модель структуры, включающая:13 концептов; отношения таких типов: родовидовые отношения, отношения несовместимости, каузальные отношения, а также, отношения, основанные на перечне из 8 семантических ролей. Некоторые концепты могут быть регулярно связаны данными отношениями.
3. Для данной построенной модели структуры онтологии предметной области «Философская практика» характерно наличие 23 связей, из которых: 5 - каузальные отношения, 5 - гиперо-гипонимические отношения, 2 - отношения несовместимости и 11 - отношения, соответствующие
отношениям предиката и его семантических ролей.
В результате, все поставленные задачи решены, а цель, заключающаяся в построении модели структуры онтологии предметной области «Философская практика» на основе исследования корпусов научных текстов на русском языке, которая может быть использована в различных задачах обработки естественного языка, достигнута.
Для достижения цели исследования было поставлено несколько задач, первой из которых стало раскрытие теоретического аспекта онтологии как модели представления знаний. Онтология - это независимая от естественного языка структура, описывающая предметы и явления реальной действительности в их восприятии человеком, создаваемая для решения определенной задачи. Существует множество классификаций онтологий, однако основным типом считается онтология предметной области.
В качестве материала исследования был использован научный корпус текстов, содержащий труды ученых по предметной области на русском языке. Объем корпуса для отбора частотных лексических единиц составил 67165 тыс. словоупотреблений, подкорпуса для вычленения отношений между концептами - 24 422 словоупотребления.
Результаты, полученные в ходе проведения исследования, позволили сформулировать следующие выводы:
1. На основе анализа для предметной области «Философская практика» характерна модель структуры, включающая 13 концептов.
2. На основе анализа для предметной области «Философская практика» характерна модель структуры, включающая:13 концептов; отношения таких типов: родовидовые отношения, отношения несовместимости, каузальные отношения, а также, отношения, основанные на перечне из 8 семантических ролей. Некоторые концепты могут быть регулярно связаны данными отношениями.
3. Для данной построенной модели структуры онтологии предметной области «Философская практика» характерно наличие 23 связей, из которых: 5 - каузальные отношения, 5 - гиперо-гипонимические отношения, 2 - отношения несовместимости и 11 - отношения, соответствующие
отношениям предиката и его семантических ролей.
В результате, все поставленные задачи решены, а цель, заключающаяся в построении модели структуры онтологии предметной области «Философская практика» на основе исследования корпусов научных текстов на русском языке, которая может быть использована в различных задачах обработки естественного языка, достигнута.





