Реферат 7
Введение 11
1. Обзор литературы (аналитический обзор) 13
1.1. Посредники в будущих информационных системах 13
1.2. IBM “Garlic” 16
1.3. Проект TSIMMIS 18
1.3.1. Модель обмена метаданными 21
1.3.2 Обработка запросов в системе TSIMMIS 22
1.3.3 Основанный на Web просмотр графов ответов модели OEM... 23
1.4 Компонент распределенного поиска информации (DISCO) 24
1.5 Система InfoSleuth 27
1.6 Система интеграции SemWIQ 31
2. Объект и методы исследования 32
2.1. Подход Semantic Web 33
2.2. Resourse Description Framework 34
2.3. Язык запросов SPARQL 35
2.4. Реляционные базы данных 35
2.4. Предлагаемое подход к решению исследуемой задачи 35
3. Разработанное решение 36
3.1. Анализ решения 36
3.2. Архитектурный стиль приложения 36
3.3. Описание модели системы 37
3.4. Выбор программных средств 38
3.4.1. Посредник-адаптер 39
3.4.2. Серверная и клиентская части 42
3.5. Требования к программной реализации 47
3.5.1. Назначение программы 47
3.5.2. Область применения 47
3.5.3. Функциональные требования 47
3.5.4. Требования к надежности 48
3.5.5. Требования к эргономике и технической эстетике 48
3.6. Проект системы 49
3.6.1. Диаграмма проектных классов 49
3.6.2. Диаграмма вариантов использования 50
3.6.3. Диаграммы последовательностей для операций проектных
классов 51
3.5. Архитектура веб-сервиса 53
4. Программная реализация системы 55
4.1 Реализация серверной части веб-сервиса 55
4.2. Пример настройки платформы D2RQ 55
Входные параметры 55
2. Generate - mapping 56
3. Запуск D2R-server 58
4. Dump-rdf 59
4.3. Реализация клиентской части веб-сервиса 61
5. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение 63
5.1. Обоснование актуальности проекта 63
5.2 Организация и планирование работ 63
5.2.1. Определение трудоёмкости выполнения НИР 64
5.3. Состав сметы затрат на выполнение проекта 68
5.3.2. Заработная плата 68
5.3.3 Затраты на социальный налог 68
5.3.4 Затраты на электроэнергию 68
5.3.5 Расчет амортизационных расходов 69
5.3.6 Расчет прочих расходов 70
5.3.7. Общая себестоимость разработки 71
5.4. Определение уровня НИР 71
5.5. Оценка экономической эффективности проекта 72
6. Социальная ответственность 73
Характеристика рабочего помещения 73
6.1. Производственная безопасность 74
6.1.1 Анализ вредных факторов проектируемой производственной
среды 74
6.1.2 Анализ опасных факторов производственной среды 81
6.2 Охрана окружающей среды 87
6.3 Защита в чрезвычайных ситуациях 87
6.4. Правовые и организационные вопросы обеспечения безопасности 89
6.4.2 Режим труда и отдыха при работе с компьютером 91
Заключение 94
Список литературы 95
На многих крупных предприятиях информация хранится в различных базах данных. Информация этих баз данных может повторяться или дополнять друг друга. Работа с распределёнными источниками баз данных сложный и не удобный процесс. Чаще всего, разные базы данных имеют различные схемы. Это не позволяет интегрировать информацию в одну большую базу данных, содержащую необходимые для работы таблицы.
Существует множество решений, относительно способов хранения информации, содержащейся в базах данных. Но эти решения не избавляют от проблемы интеграции данных из нескольких источников. Интеграция информации реляционных баз данных является актуальной задачей для специалистов, связанных с обработкой данных из разнородных источников.
В тоже время для решения задачи работы с разнородными данными WWW организация Всемирной Паутины развивает идею создания следующей версии WWW - Семантической Паутины (Semantic Web). Семантическая Паутина предполагает хранение все информации Всемирной Паутины в формате понятном и вычислительной машине, и человеку. Кроме этого данный формат предоставляет возможность выполнять на этих данных логических заключений. Семантическая паутина существует сейчас как надстройка над Всемирной Паутиной, но, к сожалению, глобально не используется. Одной из основных проблем внедрения Семантической Паутины является перевод больших объемов уже существующей информации из реляционных баз данных в формат данных Семантической паутины.
Для реализации SW уже разработано большое количество стандартов: (например, RDF/RDFS, OWL, SPARQL) и различных программных инструментов (например, D2R и Protege).
Основываясь на идеях и стандартах SW можно исследовать возможность интеграции реляционных БД организации.
Цель работы: разработать и исследовать методы и модели интеграции реляционных баз данных с использованием технологий и инструментов Semantic Web.
Объектом исследования является разнородная информация, хранящаяся в реляционных баз данных, а также методы и технологии Semantic Web.
Практическая новизна заключается в возможности интеграции баз данных в формат понятный для машинной. Это исследование может стать прочным основанием глобального использования поисковых систем, основанных только на формализованных данных. Данное исследование, также может позволить сэкономить большим организациям, которые имеют огромные базы данных.
Результаты данной работы были доложены на конференции Молодежь и современные информационные технологии.
В диссертационной работе было проведено исследование проблемы интеграции разнородных реляционных баз данных организации с использованием технологий работы с семантикой. Разработана архитектура программной системы, включающая использование посредников-адаптеров для преобразования реляционных БД в RDF граф и основанная на MVC модели проектирования программного обеспечения. На основе использования RDF графов, был разработан алгоритм интеграции. Проведено исследование возможностей D2R, RDFLib. Создан прототип программной системы, включающей клиентскую и серверную части веб сервиса, а также платформы D2R для реализации посредников-адаптеров. Проведена апробация системы на примере реляционных СУБД: PostgreSQL и MySQL.
В результате проведенного исследования показана возможность создания эффективных систем интеграции реляционных СУБД на основе стандартных инструментов Semantic Web.