Тип работы:
Предмет:
Язык работы:


Разработка и исследование гибридной системы хранения на основе Open CAS технологии

Работа №126479

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы51
Год сдачи2023
Стоимость5400 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
32
Не подходит работа?

Узнай цену на написание


Введение 4
1. Постановка задачи 6
2. Обзор 7
3. Анализ Open CAS 10
3.1. Основные обозначения 10
3.2. Основные настройки Open CAS 12
3.3. Настройка ACP very agressive politic 22
3.4. Настройки CAS для повышения производительности ра­боты с файловой системой Lustre 24
3.5. Анализатор запросов 26
4. Тесты производительности DCR Raid и Open CAS 28
4.1. Исходная конфигурация 28
4.2. Ограничения Intel CAS 28
4.3. Тесты случайных операций записи 32
4.4. Тесты смешанных нагрузок 36
4.5. Тесты последовательных операций записи малыми блоками 38
4.6. Тесты последовательных операций записи большими бло­ками 42
5. Общие рекомендации по использованию Open CAS 46
6. Заключение 48
Приложение 1 49
Список литературы 50

В современном мире объемы информации с каждым годом растут, а также увеличивается количество пользователей, запрашивающих дан­ную информацию, что повышает нагрузки и требования к системам хранения данных (СХД). Организации и компании, разрабатывающие различные продукты СХД, стремятся получить наиболее производи­тельную систему с учетом растущего объема высокопроизводительных нагрузок.
Одним из самых известных вариантов организации СХД являет­ся семейство технологий RAID - избыточный массив независимых дис­ков [13]. Производительность RAID обеспечивается за счет чередования (striping) и реже за счет зеркалирования, а отказоустойчивость за счет информационной избыточности, которая подразумевает использование дополнительных синдромных дисков предназначенных для восстанов­ления данных при частичном повреждении или утрате.
Большая часть хранимых данных имеет небольшое количество по­вторных обращений, такие данные принято называть холодными(еоИ). Они составляют значительную часть как в крупных серверных СХД, так и на накопителях обычных настольных компьютеров. Если же к данным осуществляются повторные обращения, они будут называться горячими(Ьоф.
Кэширование - это технология, в которой используется буфер для хранения часто запрашиваемых данных. Система должна определять горячие данные и перемещать их в буфер. В качестве буфера часто используются устройства хранения с более высокой производительно­стью, например, твердотельные накопители SSD или NVMe, или кэш­память в RAID контроллере, или RAM-диски (технология, позволяю­щая хранить данные в быстродействующей оперативной памяти). При запросах на чтение и запись часто запрашиваемых данных операции будут выполняться с большей скоростью и с меньшей задержкой.
Системы, которые используют кэширование вместе с HDD дисками, принято называть гибридными. Они популярны на рынке СХД, так как значительно доступнее по цене, чем массивы на основе флэш-памяти, и эффективны для работы с достаточно широким спектром задач и нагрузок. Это делает гибридные СХД подходящими для приложений, требующих большой объем хранилища.
Одним из известных продуктов, предоставляющих инструмент кэ­ширования, является Open Cache Acceleration Software (Open CAS). Open CAS - это проект с открытым исходным кодом, основная зада­ча которого предоставить инструмент кэширования за счет устройств с более высокой производительностью. В основе Open CAS лежит Open CAS Framework (OCF). OCF - это высокопроизводительная метабиб­лиотека кэширования блочного хранилища, написанная на C. Она пол­ностью независима от платформы и системы и тесно интегрируется с остальным программным стеком, обеспечивая высокопроизводитель­ную утилиту кэширования с малой задержкой. В первую очередь, OCF был разработан для кэширования данных с жестких дисков на твер­дотельных накопителях, но его также можно использовать для кэши­рования данных с твердотельных накопителей QLC на твердотельные накопители TLC, накопители Optane, оперативную память или любую комбинацию вышеперечисленного, включая все виды многоуровневых конфигураций. На текущий момент OCF — это проект, поддерживае­мый сообществом. Первоначально он был разработан Intel. Open CAS постоянно обновляется, появляются новые версии, новые функции, при этом активно работает отслеживание проблем сообществом призванное быстро исправлять обнаруженные ошибки реализации или объяснять неожиданное поведение кэша.
В данной работе предстоит повысить производительность так назы­ваемых Nested RAID (комбинация двух уровней RAID) [9] с большим количеством жестких дисков HDD c помощью Open CAS. Цель приме­нения Open CAS заключается в увеличении производительности при последовательной высокоинтенсивной нагрузке.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках выпускной квалификационной работы были получены сле­дующие результаты:
• Произведен обзор применения Open CAS для повышения произ­водительности на различных системах;
• Проанализировано влияние разных настроек и параметров Open CAS на производительность;
• Получены результаты тестов производительности Open CAS c DCR RAID в качестве core устройства;
• Выработаны рекомендации о использовании Open CAS для раз­личных паттернов нагрузок по результатам тестирования;
• С учетом выработанных рекомендаций создан анализатор запро­сов для установки параметров CAS в зависимости от нагрузки;
• Результаты работы опубликованы на SYSTOR 2023 Haifa, Israel.
В будущем предстоит:
• Реализовать другую политику очистки LRU, в которой не будет дискретности сброса;
• Увеличить линию кэша;
• Реализовать политику упреждающего чтения для нагрузок после­довательного чтения.


[1] Accomplish Optimal I/O Performance on SAS 9.3 with Intel Cache Acceleration Software and Intel DC S3700 Solid State Drive / Ying ping (Marie) Zhang, Jeff Curry, Frank Roxas, Benjamin Donie. — 2013.
[2] Axboe Jens. Flexible I/O tester. — URL: https://fio.readthedocs. io/en/latest/fio_doc.html (online; accessed: 08.12.2022).
[3] Blktrace man page.— URL: https://man7.org/linux/man-pages/ man8/blktrace.8.html (online; accessed: 02.01.2023).
[4] Chen Tingjie, Zhu Vivian. Research on perfomance tuning of HDD­based Ceph cluster using Open CAS. — 2020.
[5] Dev Null. — URL: https://ru.wikipedia.org/wiki//dev/null (on­line; accessed: 05.01.2023).
[6] IO Classification Guide.— URL: https://open-cas.github.io/ guide_io_classification.html (online; accessed: 07.01.2023).
[7] Intel. Accelerating Swift with Intel Cache Acceleration Software. — URL: https://www.intel.com/content/dam/www/public/us/en/ documents/white-papers/accelerating-swift-white-paper.pdf (online; accessed: 15.02.2023).
[8] Lustre (сетевая файловая система).— URL: https://ru. wikipedia.org/wiki/Lustre_(сетевая_файловая_система) #Объекты_данных_и_разделение_данных (online; accessed: 12.01.2023).
[9] Nested RAID.— URL: https://en.wikipedia.org/wiki/Nested_ RAID_levels (online; accessed: 08.01.2023).
[10] Open CAS main page.— URL: https://open-cas.github.io/ocf_ intro.html (online; accessed: 02.02.2023).
[11] Querry Analyzer. — URL: https://git.xinnor.io/Petrov.Iv/cas_ analys (online; accessed: 25.04.2023).
[12] RAM-диск.— URL: https://ru.wikipedia.org/wiki/RAM-диск (online; accessed: 04.01.2023).
[13] Raid.— URL: https://ru.wikipedia.org/wiki/RAID (online; ac­cessed: 22.11.2022).
[14] SUSE Enterprise Storage v5 and Intel Cache Acceleration Soft­ware Implementation. — URL: https://www.supermicro.com/ solutions/Supermicro-SES-5-CAS-Implemetation-Guide.pdf (on­line; accessed: 05.02.2023).
[15] Storage Field Day 9. — URL: https://youtu.be/uMRdzl701t8?t=682 (online; accessed: 14.01.2023).
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ