Тема: Модель информационного пространства на основе концепции семантического веба
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Принципы организации знаний 7
1.1 Понятие искусственного интеллекта. Направления и подходы
искусственного интеллекта 7
1.2 Интеллектуальный анализ данных 12
1.3 Технологические подходы к обработке знаний 14
1.4 Концепция Semantic Web, уровни представления Semantic Web 16
2 Математические модели формализации знаний 23
2.1 Методы представления и извлечений знаний 23
2.2 Методы представления и хранения семантической информации 29
2.3 Веб-технологии поиска и обработки семантической информации 39
3 Разработка программной реализации 51
3.1 Выбор языка и технологии программирования 51
3.2 Описание основных компонентов приложения 55
3.3 Порядок запуска и работы приложения 57
Заключение 63
Список использованных источников 64
Приложение А
📖 Введение
Развитие информационной инфраструктуры связано с ростом масштаба компьютерных сетей и объема передаваемых в них данных. В этих условиях механическое увеличение мощности инфраструктуры сообразно решаемым задачам может дать эффект не во всех случаях. В этой связи на первый план выходят вопросы, связанные как с поиском новых типов сетевых решений, так и с возможностью изменения качественной структуры распространяемого в них контента. Так, введение интеллектуальных механизмов распространения, хранения и обмена данными во многом повысит эффективность применения уже существующих решений.
Так, среди них можно выделить нейросетевые алгоритмы маршрутизации.
Целью работы является анализ существующих методов формализации информации, применяемых в условиях сети Интернет. Для ее реализации необходимо решить следующие задачи:
- получить представление о интеллектуальном анализе данных;
- проанализировать методы представления данных и знаний;
- проанализировать методику представления семантической информации и запросов к ней в условиях сети Интернет;
- выполнить программную реализацию семантического анализа информации с возможностью ввода данных и просмотра результатов.
Актуальность темы. Для современного общества характерно увеличение темпов развития технологий и масштабная компьютеризация, и, как следствие, стремительно возрастающая роль информации. Данное явление, ученные описывают термином «информационное общество», характеризуя его как новый социальный порядок, для которого характерно преобладание во многих сферах общественной жизни процессов, связанных с производством, распространением и переработкой информации. Неотъемлемой частью информационного общества является развитие телекоммуникационной инфраструктуры, облегчающей обмен информацией, а также создание обширного информационного пространства.
В настоящее время подобным пространством является Интернет, или, как его еще называют, Всемирная сеть. Согласно докладу Организации объединенных наций «The State оГ Broadband 2017: Broadband Catalyzing Sustainable Development», по состоянию на 2017 г. 52% населения Земли не имеет возможности взаимодействовать с Интернетом. Однако, исходя из приведенных данных следует, что примерно половина населения земли (а это миллиарды пользователей) объединена единым информационным пространством.
В настоящее время, Интернет «проник» во все сферы общественной жизни - политическую, экономическую, духовную, социальную. Интернет оказывает влияние на здравоохранение, образование, искусство. Пользователи сети осуществляют поиск необходимой информации для учебы, работы, досуга, обмениваются новостями, размещают объявления, совершают сделки и многое другое. Другими словами, непрерывно осуществляют производство, распространение и переработку информации.
И одна из самых актуальных проблем при современных объемах информации, содержащейся в Интернете - это проблема поиска. При взаимодействии со всемирной сетью, большинство людей пользуются поисковыми системами, предлагающими пользователю перечень сайтов, содержащих информацию согласно запросу. Однако при современном уровне развития и доступности технологий, количество сайтов (в зависимости от запроса) может измеряться тысячами, сотнями тысяч и миллионами. Именно эту проблему - соответствия полученной информации потребностям пользователя, призван решить Semantic Web.
Целью данной работы является исследование процессов обработки данных при помощи методов Semantic Web, такие как семантический анализ текста и выделение ключевых слов.
В соответствии с целью исследования решены задачи:
- анализ работы искусственного интеллекта, всемирной паутины в целом и Semantic Web в частности;
- исследование механизмов представления данных как их формализация в виде теоретико-графовых структур;
- разработка программной реализации приложения, обеспечивающего семантический анализ сайтов на базе библиотеки PyQt.
Объектом исследования является Semantic Web, увеличение релевантности запросов в интернете.
Предметом исследования являются процессы сбора и обработки во всемирной сети интернет, а также способы «понимания» машиной человеческого текста.
Методы исследования основаны на теории информационных систем, применяется метод семантического анализа текстовой информации, метод математической логики, метод интеллектуального анализа данных .
Научная новизна работы заключается в следующем: в данной работе был разработан программный код на языке Python, который выполняет следующие задачи:
- задание ссылки на подлежащий анализу ресурс;
- поддержка семантического анализа текстовой информации ;
- поддержка лемматизации текстовой информации, а также удаление стоп-слов;
- визуализация текстовой информации в виде семантического облака;
выделение ключевых слов в тексте на базе методов скрытого семантического анализа;
- вывод результатов.
Практическая значимость исследований. Полученные в данной работе теоретические и практические результаты позволяют проработать теги для своего сайта, что повысит релевантность сайта.
Реализация и внедрение результатов работы. Результаты работы данной программы могут быть использованы при продвижении сайтов в дальнейшем.
Достоверность полученных результатов основана на использовании современных математических методов и технологий анализа данных и компьютерного моделирования.
Результаты, выносимые на защиту:
- различные принципы и подходы организации знаний;
- модели формализации знаний, методы их представления и извлечения, методы хранения и обработки семантической информации;
- разработка программной реализации.
Диссертация состоит из введения, трех глав, заключения, списка литературы из 32 наименований и 1 приложения. Объем работы: 127 страниц основного текста, включающего 24 рисунка, 3 таблицы и 12 страниц приложений.
✅ Заключение
В процессе выполнения работы были получены следующие результаты:
1. произведен анализ работы искусственного интеллекта, всемирной паутины в целом и Semantic Web в частности;
2. выполнено исследование механизмов представления данных как их формализация в виде теоретико-графовых структур;
3. проведена разработка программной реализации приложения, обеспечивающего семантический анализ сайтов на базе библиотеки PyQt.
Корректность и верность работы программы подтверждена продемонстрированным примером, качественно отвечающим наблюдаемым в практической деятельности процессам .



