Аннотация 1
Оглавление 2
Перечень рисунков, таблиц, листингов 4
Введение 5
1 Возможные гипотезы, объясняющие популярность реляционных баз данных 6
1.1 Простота и удобство проектирования 6
1.2 Существование лучших систем управления базами данных 7
1.3 Физическая оптимизация хранения 7
1.4 Оптимизация запросов 8
1.5 Состояние рынка и интересы отдельных компаний 8
2 Первые базы данных (1964 - 1969) 9
2.1 Общая характеристика этапа 9
2.2 IBM IMS и IDS 9
3 CODASYL (1969) 11
3.1 Основные положения 11
3.2 Описание подходов 12
3.3 Язык DDL 14
3.4 Язык DML 16
3.5 Итоги этапа, с точки зрения гипотез 19
4 Возникновение реляционных баз данных. Работы Кодда (1969) 20
4.1 Основные положения 20
4.2 Операции над отношениями 21
4.3 Итоги этапа, с точки зрения гипотез 23
5 System R (1974 - 1979) 24
5.1 Цели создания System R 24
5.2 Фаза 0 25
5.3 Дальнейшее развитие 26
5.4 Итоги этапа, с точки зрения гипотез 30
6 Закрепление реляционных баз данных (1977 - 1985) 33
7 Логическая модель данных (1985) 36
8 Язык Gremlin (2009) 39
9 Дальнейшее развитие языков графовых баз данных (2011 - наши дни) 41
9.1 CYPHER 41
9.2 GQL 42
10 Современные потребности 44
11 Тренды 45
12 Современные технологии баз данных 47
12.1 Oracle 47
12.2 PostgreSQL 47
12.3 Neo4j 48
12.4 Memgraph 50
12.5 Прочие технологии 51
13 Языки, фреймворки и протоколы серверной разработки 52
14 Проблемы рынка баз данных 53
15 Будущее графовых баз данных 54
Заключение 57
Список использованных источников и Литературы
Технологии баз данных являются необходимой частью современной разработки программных продуктов. Для многих команд разработки, выбор правильной базы данных для использования, является одним из первых этапов. И прежде всего это выбор базового подхода, между реляционионным и какими-либо другими.
Несомненным лидером с точки зрения популярности баз данных по базовому подходу, являются реляционные базы данных [8]. Так, согласно рейтингу сайта db- engines.com, из 50 наиболее популярных баз данных, 31 является реляционной. В это же время, поисковые системы и документные базы данных, занимающие второе место, имеют всего по 4 вхождения. Графовые же представлены всего одним продуктом (Neo4j). И эта популярность не нова: подобное состояние сохраняется уже на протяжении нескольких десятков лет.
Графовые базы данных обладают достаточно развитой теоретической базой[1][2][7][11], и имеют значительные преимущества на определенных наборах данных. Более того, они базируются на сетевом подходе, который появился значительно раньше реляционного: первый описанный прототип, IDS[13], был разработан на 15 лет раньше аналогичного прототипа для реляционных - System R[5]. Теоретическая база, определяющая базы данных общего назначения, была тоже основана на достижениях сетевых баз данных [1][2].
Таким образом, несмотря на то, что реляционные базы данных появились в момент, когда сетевые уже имели историю применения и теоретическую базу, реляционный подход не только выдержал конкуренцию, но и стал самым популярным и распространенным подходом в современности.
В данной работе будет предпринята попытка объяснить причины быстрого роста популярности реляционных баз данных сравнимо с графовыми.
Из этой цели вытекают следующие задачи, которые будут решены в работе:
• Проанализировать развитие графовых и реляционных баз данных
• Рассмотреть современное состояние рынка баз данных
• Сделать предположение об их дальнейшем развитии
В результате работы, поставленные задачи были достигнуты:
• Произведен анализ развития графовых и реляционных баз данных
• Рассмотрено современное состояние рынка баз данных
• Сделано предположение, касательно дальнейшего развития популярных баз данных
Таким образом, цель выделения причин низкой популярности графовых баз данных можно считать достигнутой.
В дальнейшем данная работа может использоваться как базис для решения следующих задач:
• Выбор технологии для конкретного проекта
• Создание новой технологии баз данных
• Анализ причин дальнейшего развития рынка тем или иным образом