Помощь студентам в учебе
Исследование и разработка оптимизации функционирования системы хранения данных
|
Введение 4
1. Постановка задачи 6
2. Обзор используемых технологий 7
2.1. Объект тестирования 7
2.2. Менеджеры томов 7
2.2.1. ZFS 7
2.2.2. LVM 8
2.2.3. VDO 13
2.2.4. Вывод 18
2.3. Бенчмарки 18
3. Анализ рабочей нагрузки 21
4. Тестирование 23
4.1. Сравнение тонкого выделения и снепшотов с различными комбинациями LVM и VDO 23
4.2. Подбор значения параметра chunksize для LVM 28
4.2.1. Тесты 29
4.2.2. Тонкое выделение 30
4.2.3. Снепшоты 31
4.2.4. Результаты 31
5. Модуль подбора chunksize 33
5.1. QoSmic 33
5.2. Расширение для подбора chunksize 35
5.3. Результаты 36
Заключение 38
Список литературы 39
1. Постановка задачи 6
2. Обзор используемых технологий 7
2.1. Объект тестирования 7
2.2. Менеджеры томов 7
2.2.1. ZFS 7
2.2.2. LVM 8
2.2.3. VDO 13
2.2.4. Вывод 18
2.3. Бенчмарки 18
3. Анализ рабочей нагрузки 21
4. Тестирование 23
4.1. Сравнение тонкого выделения и снепшотов с различными комбинациями LVM и VDO 23
4.2. Подбор значения параметра chunksize для LVM 28
4.2.1. Тесты 29
4.2.2. Тонкое выделение 30
4.2.3. Снепшоты 31
4.2.4. Результаты 31
5. Модуль подбора chunksize 33
5.1. QoSmic 33
5.2. Расширение для подбора chunksize 35
5.3. Результаты 36
Заключение 38
Список литературы 39
В современном мире для решения профессиональных и бытовых задач люди всё чаще полагаются на информационные технологии, при этом порождая огромное количество данных, к которому рассчитывают иметь доступ. Для удовлетворения данной потребности были созданы системы хранения данных (СХД) — комплексные программноаппаратные решения, организующие хранение больших объёмов информации и обеспечивающие к ним доступ.
Иногда происходят события, влекущие за собой потерю данных. Как решение данной проблемы, а также для ускорения работы с данными используются избыточные массивы независимых дисков (RAID), за счёт различных подходов повышающие надёжность хранения информации и скорость взаимодействия с ней. В результате пользователь получает в распоряжение большой объём памяти фиксированного размера, с которым не очень удобно взаимодействовать.
Для решения вышеописанной проблемы можно использовать менеджер томов — систему управления дисковым пространством, позволяющую абстрагироваться от физических устройств. Менеджеры томов обладают различной функциональностью, такой как:
• организация памяти в соответствии с желанием пользователя — некоторые менеджеры томов позволяют объединить физические устройства в единое хранилище, а затем разбить его на участки желаемого размера;
• тонкое выделение (thin provisioning) — механизм оптимизации эффективности использования доступного пространства; при таком подходе приложениям выделяется ровно столько пространства, сколько им требуется на данный момент, вместо запрошенного приложением размера сверх текущих потребностей; таким образом снижаются требования к пространству устройства;
• снепшот (snapshot) — снимок участка системы в определённый момент времени, с помощью которого можно будет восстановить состояние системы на момент создания снимка;
• дедупликация (deduplication) — метод сокращения объёма памяти, необходимого для хранения данных; при его использовании повторяющиеся участки памяти заменяются ссылкой на первое появление участка данных;
• сжатие (compression) — метод сокращения объёма памяти, необходимого для хранения данных; устраняет избыточности, содержащиеся в исходных данных, включает, но не ограничивается дедупликацией.
Компания RAIDIX занимается разработкой систем хранения данных для задач, требующих высокой производительности, а потому их продукты в первую очередь рассчитаны на рынки, где важен именно этот показатель. На данный момент рассматривается идея создать систему хранения данных на базе RAIDIX для Enterprise рынка, который требует от СХД более расширенной функциональности.
Для достижения данной цели изначально необходимо провести обзор существующих менеджеров томов, исследовать их влияние на производительность СХД, а также создать инструмент, позволяющий подбирать параметры и отображать потенциальное влияние новых функциональностей на СХД в зависимости от типа нагрузки.
Иногда происходят события, влекущие за собой потерю данных. Как решение данной проблемы, а также для ускорения работы с данными используются избыточные массивы независимых дисков (RAID), за счёт различных подходов повышающие надёжность хранения информации и скорость взаимодействия с ней. В результате пользователь получает в распоряжение большой объём памяти фиксированного размера, с которым не очень удобно взаимодействовать.
Для решения вышеописанной проблемы можно использовать менеджер томов — систему управления дисковым пространством, позволяющую абстрагироваться от физических устройств. Менеджеры томов обладают различной функциональностью, такой как:
• организация памяти в соответствии с желанием пользователя — некоторые менеджеры томов позволяют объединить физические устройства в единое хранилище, а затем разбить его на участки желаемого размера;
• тонкое выделение (thin provisioning) — механизм оптимизации эффективности использования доступного пространства; при таком подходе приложениям выделяется ровно столько пространства, сколько им требуется на данный момент, вместо запрошенного приложением размера сверх текущих потребностей; таким образом снижаются требования к пространству устройства;
• снепшот (snapshot) — снимок участка системы в определённый момент времени, с помощью которого можно будет восстановить состояние системы на момент создания снимка;
• дедупликация (deduplication) — метод сокращения объёма памяти, необходимого для хранения данных; при его использовании повторяющиеся участки памяти заменяются ссылкой на первое появление участка данных;
• сжатие (compression) — метод сокращения объёма памяти, необходимого для хранения данных; устраняет избыточности, содержащиеся в исходных данных, включает, но не ограничивается дедупликацией.
Компания RAIDIX занимается разработкой систем хранения данных для задач, требующих высокой производительности, а потому их продукты в первую очередь рассчитаны на рынки, где важен именно этот показатель. На данный момент рассматривается идея создать систему хранения данных на базе RAIDIX для Enterprise рынка, который требует от СХД более расширенной функциональности.
Для достижения данной цели изначально необходимо провести обзор существующих менеджеров томов, исследовать их влияние на производительность СХД, а также создать инструмент, позволяющий подбирать параметры и отображать потенциальное влияние новых функциональностей на СХД в зависимости от типа нагрузки.
Возникли сложности?
Нужна помощь преподавателя?
Помощь в написании работ!
В результате проведённой работы были выполнены следующие задачи.
1. Изучены различные менеджеры томов.
2. Проведён анализ нагрузки; выделены атрибуты, на основе которых созданы сигнатуры.
3. Проведено сравнение производительности тонких томов и снепшотов, созданных с использованием менеджеров томов LVM и VDO.
4. Проведено исследование влияния параметра chunksize на производительность с целью создания базы для выявления зависимости параметра от сигнатуры.
5. Выделены признаки для обучения модели для подбора оптимального значения chunksize и оценки падения производительности.
6. Проведено первичное тестирование модели, обученной на уже имеющейся выборке.
1. Изучены различные менеджеры томов.
2. Проведён анализ нагрузки; выделены атрибуты, на основе которых созданы сигнатуры.
3. Проведено сравнение производительности тонких томов и снепшотов, созданных с использованием менеджеров томов LVM и VDO.
4. Проведено исследование влияния параметра chunksize на производительность с целью создания базы для выявления зависимости параметра от сигнатуры.
5. Выделены признаки для обучения модели для подбора оптимального значения chunksize и оценки падения производительности.
6. Проведено первичное тестирование модели, обученной на уже имеющейся выборке.
[1] Analysis and classification of multimedia I/O requests to storage system.— URL: https://dl.acm.org/doi/10.1145/2687233. 2687243 (online; accessed: 30.05.2021).
[2] Intelligent Block Level I/O workload characterization for a temporal and spatial locality aware workload generator.— URL: https://conservancy.umn.edu/bitstream/handle/11299/165578/ Palanivel_umn_0130M_15120.pdf?sequence=1&isAllowed=y (online; accessed: 30.05.2021).
[3] LVM man page.— URL: https://www.mankier.com/package/lvm2 (online; accessed: 30.05.2021).
[4] LVMVDO man page.— URL: https://www.mankier.com/7/lvmvdo (online; accessed: 30.05.2021).
[5] Logical volume manager administration.— URL: https://access. redhat.com/documentation/en-us/red_hat_enterprise_linux/ 7/html/logical_volume_manager_administration/index (online; accessed: 30.05.2021).
[6] OpenZFS man page. — URL: https://openzfs.org/wiki/Main_Page (online; accessed: 30.05.2021).
[7] Performance testing of Virtual Data Optimizer storage layer. — URL: https://is.muni.cz/th/rq7e2/petrovic_diploma_thesis. pdf (online; accessed: 30.05.2021).
[8] RAIDIX ERA.— URL: https://www.raidix.ru/products/era/ (online; accessed: 30.05.2021).
[9] Random Forest с примерами на R.— URL: http://www.algorithmist.ru/2012/05/random-forest-r.html (online; accessed: 30.05.2021).
[10] Red Hat Enterprise Linux 8. Deduplicating and compressing storage. — URL: https://access.redhat.com/documentation/en-us/ red_hat_enterprise_linux/8/html/deduplicating_and_compressing_ storage/index (online; accessed: 30.05.2021).
[11] Vdbench users guide.— URL: https://www.oracle.com/ technetwork/server-storage/vdbench-1901683.pdf (online; accessed: 30.05.2021).
[12] A complete guide to the Random Forest algorithm.— URL: https: //builtin.com/data-science/random-forest-algorithm (online; accessed: 30.05.2021).
[13] Документация Fio.— URL: https://fio.readthedocs.io/en/ latest/fio_doc.html#fio-flexible-i-o-tester-rev-version (online; accessed: 30.05.2021).
[14] Функциональное расширение QoSmic. — URL: https://raidix.ru/ files/QoSmic_RU.pdf (online; accessed: 30.05.2021).
[2] Intelligent Block Level I/O workload characterization for a temporal and spatial locality aware workload generator.— URL: https://conservancy.umn.edu/bitstream/handle/11299/165578/ Palanivel_umn_0130M_15120.pdf?sequence=1&isAllowed=y (online; accessed: 30.05.2021).
[3] LVM man page.— URL: https://www.mankier.com/package/lvm2 (online; accessed: 30.05.2021).
[4] LVMVDO man page.— URL: https://www.mankier.com/7/lvmvdo (online; accessed: 30.05.2021).
[5] Logical volume manager administration.— URL: https://access. redhat.com/documentation/en-us/red_hat_enterprise_linux/ 7/html/logical_volume_manager_administration/index (online; accessed: 30.05.2021).
[6] OpenZFS man page. — URL: https://openzfs.org/wiki/Main_Page (online; accessed: 30.05.2021).
[7] Performance testing of Virtual Data Optimizer storage layer. — URL: https://is.muni.cz/th/rq7e2/petrovic_diploma_thesis. pdf (online; accessed: 30.05.2021).
[8] RAIDIX ERA.— URL: https://www.raidix.ru/products/era/ (online; accessed: 30.05.2021).
[9] Random Forest с примерами на R.— URL: http://www.algorithmist.ru/2012/05/random-forest-r.html (online; accessed: 30.05.2021).
[10] Red Hat Enterprise Linux 8. Deduplicating and compressing storage. — URL: https://access.redhat.com/documentation/en-us/ red_hat_enterprise_linux/8/html/deduplicating_and_compressing_ storage/index (online; accessed: 30.05.2021).
[11] Vdbench users guide.— URL: https://www.oracle.com/ technetwork/server-storage/vdbench-1901683.pdf (online; accessed: 30.05.2021).
[12] A complete guide to the Random Forest algorithm.— URL: https: //builtin.com/data-science/random-forest-algorithm (online; accessed: 30.05.2021).
[13] Документация Fio.— URL: https://fio.readthedocs.io/en/ latest/fio_doc.html#fio-flexible-i-o-tester-rev-version (online; accessed: 30.05.2021).
[14] Функциональное расширение QoSmic. — URL: https://raidix.ru/ files/QoSmic_RU.pdf (online; accessed: 30.05.2021).
Работу высылаем на протяжении 30 минут после оплаты.
Подобные работы
- РАЗРАБОТКА ИНФОРМАЦИОННО -ИЗМЕРИТЕЛЬНОМ СИСТЕМЫ КОММЕРЧЕСКОГО УЧЕТА ЭЛЕКТРОЭНЕРГИИ
Дипломные работы, ВКР, эвм. Язык работы: Русский. Цена: 5900 р. Год сдачи: 2016 - Разработка автоматизированного комплекса подготовки базы данных «Полезный компьютер» (на примере НОУ ДО УЦ «Полезный компьютер»)
Дипломные работы, ВКР, информатика. Язык работы: Русский. Цена: 6100 р. Год сдачи: 2017 - РАЗРАБОТКА МЕТОДОЛОГИИ СТРУКТУРНОГО СИНТЕЗА ХРАНИЛИЩ ГЕТЕРОГЕННЫХ ДАННЫХ ПРОМЫШЛЕННОГО ПРЕДПРИЯТИЯ
Диссертации (РГБ), информационная безопасность. Язык работы: Русский. Цена: 4210 р. Год сдачи: 2021 - ОРГАНИЗАЦИЯ СИСТЕМЫ РАБОТЫ С ОБРАЩЕНИЯМИ ГРАЖДАН В ГОСУДАРСТВЕННОМ УПРАВЛЕНИИ (НА МАТЕРИАЛАХ АДМИНИСТРАЦИИ ГУБЕРНАТОРА БЕЛГОРОДСКОЙ ОБЛАСТИ)
Дипломные работы, ВКР, социальная работа. Язык работы: Русский. Цена: 6100 р. Год сдачи: 2017 - РАЗРАБОТКА ПРОГРАММНОГО КОМПЛЕКСА ПО СБОРУ ДАННЫХ
СО СРЕДСТВ УЧЕТА ЭЛЕКТРОЭНЕРГИИ
Магистерская диссертация, программирование. Язык работы: Русский. Цена: 5560 р. Год сдачи: 2017 - ОРГАНИЗАЦИЯ СИСТЕМЫ РАБОТЫ С ОБРАЩЕНИЯМИ ГРАЖДАН В ГОСУДАРСТВЕННОМ УПРАВЛЕНИИ
(НА МАТЕРИАЛАХ АДМИНИСТРАЦИИ ГУБЕРНАТОРА БЕЛГОРОДСКОЙ ОБЛАСТИ)
Дипломные работы, ВКР, муниципальное право. Язык работы: Русский. Цена: 4750 р. Год сдачи: 2017 - РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННОЙ
СИСТЕМЫ УЧЕБНО-МЕТОДИЧЕСКОГО ОТДЕЛА ВУЗА
Дипломные работы, ВКР, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2018 - Разработка автоматизированной информационной системы «Управление транспортом»
Дипломные работы, ВКР, информационные системы. Язык работы: Русский. Цена: 4360 р. Год сдачи: 2020 - АНАЛИЗ ОСНОВНЫХ ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ И ЭЛЕМЕНТОВ СИСТЕМЫ БЕРЕЖЛИВОГО ПРОИЗВОДСТВА ОАО «ЗАИНСКИЙ САХАР»
Дипломные работы, ВКР, экономика. Язык работы: Русский. Цена: 4910 р. Год сдачи: 2016