Тип работы:
Предмет:
Язык работы:


СОЗДАНИЕ МЕТОДА СРАВНЕНИЯ РЕЛЯЦИОННЫХ ТАБЛИЦ МЕЖДУ БАЗАМИ ДАННЫХ ORACLE И POSTGRESQL

Работа №41781

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы39
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
182
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 6
1. ПОСТАНОВКА ЗАДАЧИ 8
2. АНАЛИЗ СУЩЕСТВУЮЩИХ МАТЕМАТИЧЕСКИХ АЛГОРИТМОВ,
ПРИМЕНИМЫХ К СРАВНЕНИЮ РЕЛЯЦИОННЫХ ОТНОШЕНИЙ 9
2.1. Простая случайная выборка 9
2.2. Доверительный интервал 10
2.3. Алгоритм Monte-Carlo 11
2.4. Bloom filter (BF). Countable Bloom filter (CBF) 12
3. СОПОСТАВЛЕНИЕ И АНАЛИЗ СУЩЕСТВУЮЩИХ ИНСТРУМЕНТОВ И РЕШЕНИЙ ДЛЯ СРАВНЕНИЯ ТАБЛИЦ РСУБД .. 15
3.1. Red Gate SQL Data Compare 15
3.2. dbForge Data Compare 15
3.3. EMS Data Comparer 16
3.4. SQLDelta 16
3.5. SQL Comparison toolset from Idera 17
3.6. Итоги анализа существующих инструментов и решений для
сравнения таблиц РСУБД 18
4. ОПИСАНИЕ АЛГОРИТМА, ПРИМЕНЯЕМОГО В РАЗРАБОТКЕ
КОНЕЧНОГО ПРОДУКТА 19
4.1. Конечная цель работы алгоритма 19
4.2. Ограничения 19
4.3. Формализация задачи работы алгоритма 19
5. ПОСТРОЕНИЕ ВЕРОЯТНОСТНОЙ МОДЕЛИ АЛГОРИТМА 25
5.1. Вероятностная модель метода Монте-Карло в рамках решаемой
задачи 25
5.2. Вероятностная модель структуры данных Bloom Filter и Countable
Bloom Filter в рамках решаемой задачи 27
6. НАПИСАНИЕ ПРОГРАММЫ. ТЕСТИРОВАНИЕ 30
6.1. Тестирование 34
ЗАКЛЮЧЕНИЕ 37
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 38


В современном мире наблюдается рост количества информации. Согласно статистике аналитической фирмы IDC «Эра данных 2025» [13], объем данных, которые человечество накопит уже меньше чем через 10 лет составит 163 зеттабайт. Для сравнения, весь мировой объем интернет-трафика в 2016 году едва превысил 1 зеттабайт.
Для хранения огромного количества данных требуются мощные и современные системы управления базами данных (СУБД), примерами которых являются: Oracle, PostgreSQL, MySQL, Microsoft SQL Server, MongoDB и так далее [12].
На сегодняшний день наблюдается рост популярности использования PostgreSQL [12]. В России это обосновано развитием сообщества благодаря мероприятиям PG Day и PG Conf и постоянным расширением функциональных возможностей PostgreSQL. Массовая миграция данных в рамках импортозамещения поднимает вопрос сравнения перенесенных данных.
Актуальность данной задачи также подтверждается в ходе работы над репликацией/миграцией данных в другой центр обслуживания данных для распределенных/гетерогенных реляционных систем баз данных [1].
В настоящее время требуется метод описания и инструмент, который предоставит возможность сравнивать данные между таблицами в разных агрегированных вариантах, не используя метод перебора всех строк или сравнения построчно.
Целью настоящей работы является создание инструмента эффективного сравнения таблиц следующих пар типов РСУБД:
1. PostgreSQL ^ Oracle,
2. PostgreSQL ^ PostgreSQL,
3. Oracle ^ Oracle.
При переносе большого количества данных путем замены одной СУБД на другую специалисты не могут гарантировать корректность и целостность переноса в связи с тем, что могут возникнуть внутренние, непредсказуемые ошибки из-за различий реализаций двух реляционных баз данных, также ошибки, связанные с различием типов данных, различием внутренних функций, различием синтаксиса последовательностей и так далее [14]. Процесс миграции нужно рассматривать в комплексе с обеспечением мер по отказоустойчивости, резервированию и безопасности новой системы. Существующие на данный момент инструменты предоставляют возможность сравнения только построчно [6, 7, 8, 9, 10]. Данный подход является большим неудобством в мире, когда данные превышают несколько сотен гигабайт на одну реляционную таблицу из - за ограничений временных ресурсов.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В результате выполнения данной дипломной работы было разработано программное решение для эффективного сравнения таблиц РСУБД для следующих типов РСУБД:
1. PostgreSQL ^ Oracle,
2. PostgreSQL ^ PostgreSQL,
3. Oracle ^ Oracle.
В рамках дипломной работы были выполнены следующие задачи:
1. Описан круг сравнительных характеристик над реляционными таблицами.
2. Создана физическая формализация сравнительных характеристик в форме реляционных SQL-запросов к таблице в исходной базе данных и к таблице в конечной базе данных.
3. Создан инструмент, использующий разные варианты сравнения данных на основе описанных сравнительных характеристик и возвращающий финальный отчет о сравнении.
4. Использован фильтр Блума и метод Монте-Карло для получения информации о равенстве реляционных объектов.
Данная работа также размещена в открытом доступе на сайте GitLab по ссылке http: //gititis.kpfu.ru/Klinov/comparison_of_tables.



1. Birialtsev, E., Intelligent search in Big Data [Text] / E. Birialtsev // Approach to data integration. - 2017. - V. 46. - №19. - P. 7-14.
2. Chen G., Guo D., Luo L., Ren B. Optimization of multicast source routing based on bloom filter [Text] / G. Chen, D. Guo, L. Luo, B. Ren // IEEE Communication Letters. - 2018. - №4. - P. 700-703.
3. Kareev, I., Lower bounds for expected sample size of sequential procedures for the multinomial selection problems [Text] / I. Kareev // Communications in Statistics. - 2017. - V. 913. - №1. - P. 1-29.
4. Wu K. , Tan H., Liu Y., Zhang J., Zhang Q., Ni L. Side channel: Bits over interference [Text] / K. Wu, H. Tan, Y. Liu, J. Zhang, Q. Zhang, L. M. Ni // IEEE Transactions on Mobile Computing. - 2017. - №8. - С. 1317-1330.
5. Афанасьев, Г. И., База Данных NoSql и их сравнение с традиционными базами данных [Текст] / Г. И. Афанасьев, А. Д. Марков // Теория Инноваций. - 2017. - №5-2. - С. 4-10.
6. Официальная документация к инструменту сравнения таблиц РСУБД “Devart” [Электронный ресурс]. - Режим доступа: https://www.devart.com (Дата обращения: 19.11.2018).
7. Официальная документация к инструменту сравнения таблиц РСУБД “Idera” [Электронный ресурс]. - Режим доступа: https://www.idera.com (Дата обращения: 17.01.2019).
8. Официальная документация к инструменту сравнения таблиц РСУБД “Red Gate” [Электронный ресурс]. - Режим доступа: https://www.red-gate.com (Дата обращения: 11.11.2018).
9. Официальная документация к инструменту сравнения таблиц РСУБД “SQL Delta” [Электронный ресурс]. - Режим доступа: https://www.sqldelta.com(Дата обращения: 04.12.2018).
10.Официальная документация к инструменту сравнения таблиц РСУБД “SQL Manager” [Электронный ресурс]. - Режим доступа: https://www.sqlmanager.net (Дата обращения: 03.12.2018).
11. Официальная документация РСУБД “Oracle Database” [Электронный ресурс]. - Режим доступа: https://www.oracle.com/ru/database/ (Дата обращения: 10.02.2019).
12. Сайт DB-engines [Электронный ресурс]. - Режим доступа: https://db- engines.com/en/ranking_trend (дата обращения 27.04.2019).
13. Сайт Seagate [Электронный ресурс]. - Режим доступа: https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate- dataage-whitepaper.pdf (дата обращения: 25.04.2019).
14. Сайт Searchqlserver [Электронный ресурс]. - Режим доступа: https://searchsqlserver.techtarget.com/definition/database (дата обращения:
23.05.2019)
15. Сайт W3techs. Trends in the usage of server-side languages for websites
[Электронный ресурс]. - Режим доступа:
https://w3techs.com/technologies/history_overview/programming_language/m s/y (дата обращения 15.04.2019).
16. Тишин, А. О., Разработка базы данных завершенных проектов [Текст] / А. О. Тишин // Евразийский научный журнал. - 2017. - №5. - С. 456-457.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ