Тип работы:
Предмет:
Язык работы:


Интеграция файловых хранилищ ZFS с СУБД PostgreSQL

Работа №147503

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы28
Год сдачи2024
Стоимость5500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
22
Не подходит работа?

Узнай цену на написание


1. Введение 4
2. Постановка задачи 6
3. Обзор 7
3.1. PostgreSQL Large Objects 7
3.2. bytea 7
3.3. Работа с метаданными файлов 8
3.4. Внешние хранилища данных 10
4. Предлагаемое решение 11
4.1. Описание решения 11
4.2. Расширение PostgreSQL для работы с ZFS 13
5. Тестирование и апробация 18
6. Заключение 19
Список литературы 20


Количество информации, которая генерируется и хранится в компьютерах пользователей, постоянно возрастает: по оценкам некоторых источников [4] объем информации, доступной в сети Интернет, измеряется в зеттабайтах. Эти объемы информации требуют круглосуточного хранения и постоянной обработки. Одним из основных способов хранения и работы с данными являются системы управления и обработки информации (СУБД). Учитывая различный характер видов информации, которыми оперируют пользователи, и способов их обработки, существует большое количество различных СУБД, но наибольшее распространение и развитие получили реляционные СУБД.
Современные реляционные СУБД имеют широкие возможности для представления, хранения и обработки разнородных данных пользователей. Существенная доля этих данных вносится в СУБД в неструктурированном (не реляционном) формате. Яркими примерами систем хранения и обработки неструктурированной информации являются DLP- системы и торговые системы. DLP-системы [1] отвечают за безопасность информационного обмена и сигнализируют о возможных утечках. Такие системы оперируют большим количеством данных пользователей, в число которых входят: документы, изображения, обмен информацией через файловые хранилища и другие действия пользователей. Различные торговые системы часто хранят тысячи и сотни тысяч изображений товаров и должны иметь возможность оперативно работать с этими данными. Организация хранения неструктурированных бинарных данных в БД является сложной и актуальной задачей, которую разработчики должны решать при создании информационной системы.
Распространенным способом хранения неструктурированной информации в компьютерных системах являются файлы. СУБД также имеют множество различных решений, которые позволяют разработчикам реализовывать программные компоненты для связи информации в базах данных и файловых хранилищах. Можно выделить такие решения, как наличие в СУБД специализированных типов данных и модулей для хранения произвольных бинарных данных, возможность интеграции с внешними объектными хранилищами, поддержка в СУБД стандарта SQL/MED и другие решения. Представленные подходы не лишены недостатков, их использование усложняет процесс разработки информационных систем и связанных с ним задач хранения и обработки произвольных неструктурированных данных пользователей. Поэтому задача реализации эффективных и простых инструментов для разработчика, позволяющих оперировать большими объемами неструктурированной информации (изображения, файлы, документы и т.п.) в базах данных является актуальной. Обязательным условием реализации этих инструментов должна быть поддержка основных гарантий транзакционных систем при хранении и обработке неструктурированных данных пользователя.
В работе предложен и реализован новый способ прямого доступа из СУБД к файлам пользователей, расположенных на подключаемом внешнем хранилище. В качестве СУБД в работе выбрана PostgreSQL, файлы пользователей размещаются в пулах файловой системы ZFS. Работа выполняется в команде из двух человек. В данной работе рассматривается верхний уровень всей системы - создание расширения для СУБД, которое позволит разрабатывать интерфейсы прямого доступа к файловым хранилищам ZFS на языке SQL.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе работы были достигнуты следующие результаты.
• Проанализированы существующие подходы к решению задачи работы с бинарными данными в PostgreSQL.
• Определен подход к реализации взаимодействия с файловой системой ZFS в PostgreSQL.
• Реализовано расширение для взаимодействия с файловой системой ZFS.
• Проведено тестирование разработанного решения.
Код проекта закрыт и принадлежит компании ООО ”Датаджайл”.



[1] Arbel Lior. Data loss prevention: the business case // Computer Fraud Security. — 2015. — Vol. 2015, no. 5. — P. 13-16. — URL: https://www. sciencedirect.com/science/article/pii/S1361372315300373.
[2] Foreign data wrappers - PostgreSQL wiki. — https://www. postgresql.org/docs/current/postgres-fdw.html. — Accessed: 2023-04-04.
[3] Foreign data wrappers - PostgreSQL wiki. — https://wiki. postgresql.org/wiki/Foreign_data_wrappers.— Accessed: 202304-04.
[4] Krotov Vlad, Johnson Leigh. Big web data: Challenges related to data, technology, legality, and ethics // Business Horizons. — 2023. — Vol. 66, no. 4.— P. 481-491.— URL: https://www.sciencedirect. com/science/article/pii/S0007681322001252.
[5] Melton Jim. Chapter 5 - Foreign Servers and Foreign-Data Wrappers // Advanced SQL:1999 / Ed. by Jim Melton.— San Francisco : Morgan Kaufmann, 2003. — The Morgan Kaufmann Series in Data Management Systems.— P. 235-278.— URL: https://www.sciencedirect. com/science/article/pii/B9781558606777500067.
[6] PostgreSQL: Documentation: 16: pgbench. — 2024.— https://www. postgresql.org/docs/current/pgbench.html.— Accessed: 2024-0525.
[7] SQL/MED: A Status Report / Jim Melton, Jan Eike Michels, Vanja Josifovski et al. // SIGMOD Rec.-- 2002.— sep.— Vol. 31, no. 3.-- P. 81-89.-- URL: https://doi.org/10.1145/601858. 601877.
[8] Меликов Георгий. ZFS: архитектура, особенности и отличия от других файловых систем // «Завтра облачно», журнал о цифровой трансформации от VK Cloud Solutions. — 2020. — https://mcs. mail.ru/blog/zfs-arhitektura-osobennosti-i-otlichija. — Accessed: 2023-04-04.



Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ