Тип работы:
Предмет:
Язык работы:


Исследование и разработка оптимизации функционирования системы хранения данных

Работа №127865

Тип работы

Бакалаврская работа

Предмет

информационные системы

Объем работы40
Год сдачи2021
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
29
Не подходит работа?

Узнай цену на написание


Введение 4
1. Постановка задачи 6
2. Обзор используемых технологий 7
2.1. Объект тестирования 7
2.2. Менеджеры томов 7
2.2.1. ZFS 7
2.2.2. LVM 8
2.2.3. VDO 13
2.2.4. Вывод 18
2.3. Бенчмарки 18
3. Анализ рабочей нагрузки 21
4. Тестирование 23
4.1. Сравнение тонкого выделения и снепшотов с различными комбинациями LVM и VDO 23
4.2. Подбор значения параметра chunksize для LVM 28
4.2.1. Тесты 29
4.2.2. Тонкое выделение 30
4.2.3. Снепшоты 31
4.2.4. Результаты 31
5. Модуль подбора chunksize 33
5.1. QoSmic 33
5.2. Расширение для подбора chunksize 35
5.3. Результаты 36
Заключение 38
Список литературы 39

В современном мире для решения профессиональных и бытовых за­дач люди всё чаще полагаются на информационные технологии, при этом порождая огромное количество данных, к которому рассчитыва­ют иметь доступ. Для удовлетворения данной потребности были со­зданы системы хранения данных (СХД) — комплексные программно­аппаратные решения, организующие хранение больших объёмов инфор­мации и обеспечивающие к ним доступ.
Иногда происходят события, влекущие за собой потерю данных. Как ре­шение данной проблемы, а также для ускорения работы с данными ис­пользуются избыточные массивы независимых дисков (RAID), за счёт различных подходов повышающие надёжность хранения информации и скорость взаимодействия с ней. В результате пользователь получает в распоряжение большой объём памяти фиксированного размера, с ко­торым не очень удобно взаимодействовать.
Для решения вышеописанной проблемы можно использовать менеджер томов — систему управления дисковым пространством, позволяющую абстрагироваться от физических устройств. Менеджеры томов облада­ют различной функциональностью, такой как:
• организация памяти в соответствии с желанием пользователя — некоторые менеджеры томов позволяют объединить физические устройства в единое хранилище, а затем разбить его на участки желаемого размера;
• тонкое выделение (thin provisioning) — механизм оптимизации эф­фективности использования доступного пространства; при таком подходе приложениям выделяется ровно столько пространства, сколько им требуется на данный момент, вместо запрошенного приложением размера сверх текущих потребностей; таким обра­зом снижаются требования к пространству устройства;
• снепшот (snapshot) — снимок участка системы в определённый момент времени, с помощью которого можно будет восстановить состояние системы на момент создания снимка;
• дедупликация (deduplication) — метод сокращения объёма памя­ти, необходимого для хранения данных; при его использовании повторяющиеся участки памяти заменяются ссылкой на первое появление участка данных;
• сжатие (compression) — метод сокращения объёма памяти, необ­ходимого для хранения данных; устраняет избыточности, содер­жащиеся в исходных данных, включает, но не ограничивается де­дупликацией.
Компания RAIDIX занимается разработкой систем хранения данных для задач, требующих высокой производительности, а потому их про­дукты в первую очередь рассчитаны на рынки, где важен именно этот показатель. На данный момент рассматривается идея создать систему хранения данных на базе RAIDIX для Enterprise рынка, который тре­бует от СХД более расширенной функциональности.
Для достижения данной цели изначально необходимо провести обзор существующих менеджеров томов, исследовать их влияние на произво­дительность СХД, а также создать инструмент, позволяющий подби­рать параметры и отображать потенциальное влияние новых функциональностей на СХД в зависимости от типа нагрузки.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В результате проведённой работы были выполнены следующие задачи.
1. Изучены различные менеджеры томов.
2. Проведён анализ нагрузки; выделены атрибуты, на основе кото­рых созданы сигнатуры.
3. Проведено сравнение производительности тонких томов и снепшотов, созданных с использованием менеджеров томов LVM и VDO.
4. Проведено исследование влияния параметра chunksize на произво­дительность с целью создания базы для выявления зависимости параметра от сигнатуры.
5. Выделены признаки для обучения модели для подбора оптималь­ного значения chunksize и оценки падения производительности.
6. Проведено первичное тестирование модели, обученной на уже име­ющейся выборке.


[1] Analysis and classification of multimedia I/O requests to storage system.— URL: https://dl.acm.org/doi/10.1145/2687233. 2687243 (online; accessed: 30.05.2021).
[2] Intelligent Block Level I/O workload characterization for a temporal and spatial locality aware workload generator.— URL: https://conservancy.umn.edu/bitstream/handle/11299/165578/ Palanivel_umn_0130M_15120.pdf?sequence=1&isAllowed=y (online; accessed: 30.05.2021).
[3] LVM man page.— URL: https://www.mankier.com/package/lvm2 (online; accessed: 30.05.2021).
[4] LVMVDO man page.— URL: https://www.mankier.com/7/lvmvdo (online; accessed: 30.05.2021).
[5] Logical volume manager administration.— URL: https://access. redhat.com/documentation/en-us/red_hat_enterprise_linux/ 7/html/logical_volume_manager_administration/index (online; accessed: 30.05.2021).
[6] OpenZFS man page. — URL: https://openzfs.org/wiki/Main_Page (online; accessed: 30.05.2021).
[7] Performance testing of Virtual Data Optimizer storage layer. — URL: https://is.muni.cz/th/rq7e2/petrovic_diploma_thesis. pdf (online; accessed: 30.05.2021).
[8] RAIDIX ERA.— URL: https://www.raidix.ru/products/era/ (online; accessed: 30.05.2021).
[9] Random Forest с примерами на R.— URL: http://www.algorithmist.ru/2012/05/random-forest-r.html (online; accessed: 30.05.2021).
[10] Red Hat Enterprise Linux 8. Deduplicating and compressing storage. — URL: https://access.redhat.com/documentation/en-us/ red_hat_enterprise_linux/8/html/deduplicating_and_compressing_ storage/index (online; accessed: 30.05.2021).
[11] Vdbench users guide.— URL: https://www.oracle.com/ technetwork/server-storage/vdbench-1901683.pdf (online; accessed: 30.05.2021).
[12] A complete guide to the Random Forest algorithm.— URL: https: //builtin.com/data-science/random-forest-algorithm (online; accessed: 30.05.2021).
[13] Документация Fio.— URL: https://fio.readthedocs.io/en/ latest/fio_doc.html#fio-flexible-i-o-tester-rev-version (online; accessed: 30.05.2021).
[14] Функциональное расширение QoSmic. — URL: https://raidix.ru/ files/QoSmic_RU.pdf (online; accessed: 30.05.2021).


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ