Введение 5
Глава 1. Обзор теоретических материалов по теме онтологического инженеринга 6
1.1. Определение онтологии 6
1.1.1. Понятие онтологии 6
1.2. Классификация онтологий 8
1.2.1. По объекту концептуализации 10
1.2.2. По степени формальности 11
1.2.3. По уровню выразительности 14
1.2.4. По языку представления онтологических знаний 15
1.3. Методы разработки онтологий 15
1.4. Тезаурусы 18
Глава 2. Описание компании ПАО «Газпром нефть» и её дочерних компаний 19
2.1. Общее описание компании «Газпром Нефть» 19
2.1.1. Создание собственного ИТ-кластера 21
2.2. Общее описание компании «Газпром нефть НТЦ» 22
2.3. Общее описание компании «Газпромнефть-Цифровые решения» 22
Глава 3. Развитие онтологии корпоративного поиска 24
3.1 Обзор системы корпоративного поиска «Газпром Нефть» 24
3.2. Описание и анализ текущей онтологии в корпоративном поиске 28
3.3. Разработка тезауруса предметной области «Геологоразведка» 30
3.3.1. Методика построения 32
3.3.3. Подготовка неформальной онтологии 36
3.3.4. Создание онтологии в Protégé 41
Заключение 51
Список использованной литературы 53
Сегодня сотрудники организаций, особенно сотрудники крупных компаний, тратят огромное количество времени на поиск информации. По результатам исследований , 36% времени уходит на поиск знаний в компаниях. Огромный рост технологий приводит к тому, что накапливается огромные массивы знаний. Проблема заключается в том, что зачастую эти знания так и остаются в необработанном виде, а инструменты для структурирования этой информации попросту отсутствует. Нужно понимать, что компаниям приходится расплачиваться за свое неумение организовать и структурировать свои данные упущенными возможностями. Если внутри компании плохо работает так называемый трансфер информации, компания непременно теряет часть данных, а из-за этого у нее не будет возможности налаживать и оптимизировать свои бизнес-процессы. Некоторые компании прибегают к локальному решению проблемы, они создают отдельные базы знаний, в которых эксперты вручную заносят знания. Но очевидно, это будет не совсем актуально для крупных компаний. Например, таких, как Газпром Нефть. В этой организации объем файлового хранилища уже превышает 350 ТБ.
Целью моей работы является разработка онтологии одной из предметных областей компании «Газпром нефть», которая поможет развитию системы корпоративного поиска.
В своей работе я поставила следующие задачи:
1.Рассмотрение теоретических основ разработки онтологии
2.Рассмотрение принципов работы корпоративного поиска и роль онтологии в не
3.Создание тезауруса выбранной области
4.Рассмотрение и адаптация текущей методологии разработки онтологий в компании
В первой главе данной выпускной квалификационной работы мною были рассмотрены торические материалы, статьи, учебники, различная литература как на тему базовых знаний в предметной области онтологии, так и более глубокие и специфические моменты, которые были необходимы для прохождения практики в компании «Газпром нефт» для написания данной дипломной работы, поскольку мне приходилось общаться с представителями компании с достаточным глубоким уровнем экспертизы в данной области. Важно отметить, что мою были просмотрены записи лекций преподавателей Высшей Школы Менеджмента специально для сотрудников компании «Газпром Нефть», материалы которых не были представлены в рамках ни одного из курсов. Таким образом, мною были описаны как общие понятия, так и различные подходы к классификации онтологий и методов онтологического инжиниринга. В целом считаю анализ литературы и изучение источников, поиск информации на эту тему самым важным этапом этой работы, поскольку от глубины уровня понимания темы зависла дальнейшая работа. Я приобрела много новых знаний в онтологическом инжиниринге, а качественное изучение литературы помогло сформировать комплексное понимание изученной тематике.
Во второй главе мною была рассмотрена компания в рамках деятельности которой и строилась моя выпускная квалификационная работа. Мною были описаны как общая информация о компании «Газпром Нефть», так и тенденция на цифровизацию бизнеса, которая, безусловна, находит отражение в деятельности всей компании, что позволяет лучше понять стратегию компанию. Помимо этого, мною была описана и проанализирована и описана деятельность двух дочерних организаций компании «Газпром Нефть»: «Газпромнефть-Цифровые решения» и «Газпром нефть НТЦ», что также позволило сформировать общее представление о всей корпорации.
Следующая, третья глава является основной и заключительной. Сначала мною был изучен корпоративный поиск, который является выдающимся проектом компании «Газпром нефть». На основании собственного опыта работы в нём и изучении источников компании, я коротко, но емко писала основные моменты устройства и принципов работы когнитивного поиска в компании. Затем мне было необходимо понять роль и значение тезауруса в корпоративном поиске, для этого мною было проведено интервью с представителями отдела корпоративного поиска, а также я непосредственно работала в панели администрирования тезауруса корпоративного поиска.
Таким образом, я описала принципы устройства тезауруса, роль концепта в системе корпоративного поиска, я описала процесс создания, который непосредственно повлиял на текущий его вид. Онтология корпоративного поиска была мною проанализирована и классифицирована.
Во второй половине 3 главы я приступила к непосредственной работе над созданием тезауруса. Мною была выбрана предметная область «геологоразведки», нуждающаяся в доработке. На основании нескольких методик построения онтологии я составила подходящий мне способ онтологического инжиниринга, который должен удовлетворять два критериям:
• Применимость результатов на практике
• «Защищабельность» результатов перед комиссией
Важным шагом была разработка неформально предметной области, мне потребовалось много времени на внимательное изучение и выбор ресурсов После того как неформальная онтология была сформулирована, необходимо было добавит её в программу Protégé. Для этого мною были изучение различные видео-материалы, статьи. Особое внимание я уделила характеристикам свойств, которые представляли собой связи. Я выбрала их формальность, симметричности или асимметричностью, в зависимости от типа связи, а также настроила обратную зависимость для более полной картины тезауруса. В результате, тезаурус принял полуформальный вид, который можно как презентовать на защите, так и внедрять в корпоративную систему поиска. Помимо этого мною были формулированы рекомендации по доработки процесса создания неформальной модели тезауруса.
Таким образом, результатом моей выпускной квалификационной работы является тезаурус предметной области «Геологоразведка», который включает в себя 108 концептов, между которыми 232 раза было использовано свойство «связан_с», и 50 раз связь «уже_чем». Этот тезаурус представлен в неформальном виде для компании «Газпром нефть» и добавлен в программу Protégé для формализации модели.
1. Гаврилова Т. А. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем //Новости искусственного интеллекта. – 2003. – №. 2. – С. 24-30. (http://bigc.ru/publications/bigspb/km/ontol_podhod_to_uz.php#1 )
2. Гаврилова Т.А. Модели и методы структурирования знаний: визуальный подход [Электронный ресурс]/ Сайт spbu.ru, URL: https://spbu.ru/sites/default/files/20160328_protocol_us_sp, свободный. – Загл. с экрана (дата обращения - 13.03.2021)
3. Газпром нефть создает собственный ИТ-кластер для ускорения цифровой трансформации [Электронный ресурс]/ Сайт Neftegaz.RU, URL:https://neftegaz.ru/news/tsifrovizatsiya/549554-gazprom-neft-sozdaet-sobstvennyy-it-klaster-dlya-uskoreniya-tsifrovoy-transformatsii/ , свободный. – Загл. с экрана (дата обращения - 10.02.2021)
4. Газпром нефть» создает собственный ИТ-кластер для ускорения цифровой трансформации [Электронный ресурс]/ Сайт компании «Газпром нефть», URL:https://www.gazprom-neft.ru/press-center/news/gazprom_neft_sozdaet_sobstvennyy_it_klaster_dlya_uskoreniya_tsifrovoy_transformatsii/, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
5. Главный НПЗ России [Электронный ресурс]/ Сайт Омского нефтеперерабатывающего завода «Газпром нефть», URL:https://onpz.gazprom-neft.ru/ , свободный. – Загл. с экрана (дата обращения - 10.02.2021)
6. Годовой отчет 2018 год [Электронный ресурс]//Газпром нефть. Режим доступа https://ir.gazprom-neft.ru/fileadmin/user_upload/documents/annual_reports/gpn_ar18_rus_1909.pdf (дата обращения 12.02.2020)
7. Горелова А. А., Попова О. А., Филиппова З. М. Понятие системы онтологий и ее применение для характеристики условий терригенного осадконакопления //Территория Нефтегаз. – 2019. – №. 12.
8. Добров Б. В. и др. Онтологии и тезаурусы: учебно-методическое пособие //Казань: Изд-во Казанского ГУ. – 2006.
9. Завод для города [Электронный ресурс]/ Сайт Сайт Московского нефтеперерабатывающего завода «Газпром нефть», URL:https://mnpz.gazprom-neft.ru/ , свободный. – Загл. с экрана (дата обращения - 10.02.2021)
10. Корпоративный поиск – единая точка доступа к знаниям компании [Электронный ресурс]/ Сайт GlobalCIO, URL:https://globalcio.ru/live/projects/10524/, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
11. Кудрявцев Д. В. Системы управления знаниями и применение онтологий: учебное пособие. – 2010.
12. Лаврищева Е. М., Карпов Л. Е., Томилин А. Н. Семантические ресурсы для разработки онтологии научной и инженерной предметных областей //Труды. XVIII Всероссийский научной конференции «Научный сервис в сети Интернет. – 2016. – С. 223-239.
13. Митрофанова О. А., Константинова Н. С. Онтологии как системы хранения знаний. – 2008.
14. Награждение «Проект Года 2018» [Электронный ресурс]/ Сайт GlobalCIO, URL:https://globalcio.ru/discussion/1863/, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
15. Нариньяни А.С. ТЕОН-2: ОТ ТЕЗАУРУСА К ОНТОЛОГИИ И ОБРАТНО [Электронный ресурс]/ Сайт, HYPERLINKURL:http://www.dialog-21.ru/digest/2002/articles/narinyani/ , свободный. – Загл. с экрана (дата обращения - 10.02.2021)
16. НАУЧНАЯ ДЕЯТЕЛЬНОСТЬ [Электронный ресурс]/ Сайт научно-технического центра компании «Газпром нефть», URL:https://ntc.gazprom-neft.ru/research-and-development/science/, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
17. НАУЧНО-ТЕХНИЧЕСКИЙ ЦЕНТР «ГАЗПРОМ НЕФТИ» [Электронный ресурс]/ Сайт научно-технического центра компании «Газпром нефть», URL:https://ntc.gazprom-neft.ru/about/hello-ntc /, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
18. НАУЧНО-ТЕХНИЧЕСКИЙ ЦЕНТР «ГАЗПРОМ НЕФТИ» [Электронный ресурс]/Сайт,URL:https://www.naumen.ru/digital-transformation/gazpromneft.php, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
19. НПЗ Панчево (NIS, Сербия) [Электронный ресурс]/ Сайт компании «Газпром нефть», URL:https://www.gazprom-neft.ru/company/oil-refining/nis-refinery/, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
20. Объявлены победители конкурса "Проект Года 2018" [Электронный ресурс]/ Сайт COMNEWS, URL:https://www.comnews.ru/content/117426/2019-01-31/obyavleny-pobediteli-konkursa-proekt-goda-2018, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
21. Сладкова Е., Зорина С. Умный поиск [Электронный ресурс]/ Сайт компании «Газпром нефть», URL: https://www.gazprom-neft.ru/press-center/sibneft-online/archive/2020-november/5117433/ , свободный. – Загл. с экрана (дата обращения - 10.02.2021)
22. Филиппович А. Тезаурус vs. Онтология [Электронный ресурс]/ Персональный блог Филипповича Андрея,URL: http://blogs.it-claim.ru/andrey/2011/01/18/, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
23. Электронный ресурс] / Сайт posp.raai.org, URL: http://posp.raai.org/data/posp2005/gavrilova/gavrilova.html , свободный. – Загл. с экрана (дата обращения - 10.02.2021)]
24. Cmap software is a result of research conducted at the Florida Institute for Human & Machine Cognition (IHMC). It empowers users to construct, navigate, share and criticize knowledge models represented as concept maps [Электронный ресурс]/ СайтCmap, URL:https://cmap.ihmc.us/, свободный. – Загл. сэкрана (дата обращения - 13.03.2021)
25. Controlled vocabulary thesaurus onthology [Электронный ресурс]/ Сайт, URL: http://www.dianebowen.net/controlled-vocabulary-thesaurus-ontology.html , свободный. – Загл. сэкрана (дата обращения - 10.02.2021)
26. Gómez-Pérez A., Fernández-López M., Corcho O. Ontological Engineering: with examples from the areas of Knowledge Management, e-Commerce and the Semantic Web. – Springer Science & Business Media, 2006.
27. Gruber T. R. A translation approach to portable ontology specifications //Knowledge acquisition. – 1993. –
28. Gruber T. R. A translation approach to portable ontology specifications //Knowledge acquisition. – 1993. – Т. 5. – №. 2. – С. 199-220.
29. Gruber T. R. A translation approach to portable ontology specifications //Knowledge acquisition. – 1993. – Т. 5. – №. 2. – С. 199-220.
30. Lassila O, McGuiness D, The role of frame-based representation on the semantic web //Linköping Electronic Articles in Computer and Information Science. – 2001
31. Noy N. F. et al. Ontology development 101: A guide to creating your first ontology. – 2001.
32. Noy N. F. et al. Ontology development 101: A guide to creating your first ontology. – 2001.
33. Protégé is a free, open-source platform that provides a growing user community with a suite of tools to construct domain models and knowledge-based applications with ontologies [Электронный ресурс]/ Сайт Protégé, URL:https://protege.stanford.edu/products.php , свободный. – Загл. сэкрана (дата обращения - 13.03.2021)
34. UnifiedMedicalLanguageSystem (UMLS) [Электронный ресурс]/ Сайт, URL:https://www.nlm.nih.gov/research/umls/index.html, свободный. – Загл. с экрана (дата обращения - 10.02.2021)
35. Uschold M. et al. Ontologies: Principles, methods and applications //TECHNICAL REPORT-UNIVERSITY OF EDINBURGH ARTIFICIAL INTELLIGENCE APPLICATIONS INSTITUTE AIAI TR. – 1996.