Тип работы:
Предмет:
Язык работы:


Проектирование сервиса управления процессом обработки данных на специализированной распределенной вычислительной системе SPD Online filter

Работа №142224

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы55
Год сдачи2023
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
13
Не подходит работа?

Узнай цену на написание


Список сокращений и условных обозначений 3
Введение 4
Организация SPD Online Filter 6
Постановка задачи 9
Глава 1. Обзор существующих решений и инструментов 10
ATLAS production system 10
Использование готовых инструментов для управления процессом обработки данных. Apache Airflow 13
Глава 2. Определение требований к WfMS 15
Функциональные требования к системе wfms 15
Основные шаги обработки данных: 16
Глава 3. Организация данных 17
Входные данные 17
Промежуточные данные 17
Выходные данные 18
Глава 4. Взаимодействие с другими системами SPD Online Filter 19
Взаимодействие с Data Management System 19
Взаимодействие с Workload Management System 24
Глава 5. Сервисы Workflow Management System 30
Сервис для взаимодействия с оператором обработки данных 31
Сервис для опроса DMS 37
Сервис для генерации заданий 38
Сервис для опроса WMS и удаления промежуточных данных 41
Выбор технологий 44
Выбор языка программирования 44
Выбор асинхронного фреймворка 44
Выбор брокера сообщений 45
RabbitMQ 46
Apache Kafka 47
Глава 6. Итоговая архитектура Workflow Management System 49
Заключение 52
Список литературы 53

SPD (Spin Physics Detector) это строящийся эксперимент на коллайдере NICA, мегасайенс-установке, которая строится в ОИЯИ (г.Дубна, Россия) см. Рис. 1.
Основная цель эксперимента — проверка основ квантовой хромодинамики путем изучения поляризованной структуры нуклона и спиновых явлений при столкновении продольно и поперечно поляризованных протонов и дейтронов с энергией центра масс до 27 ГэВ и светимостью до 1032 см-2 с-1.
Детектор SPD задуман как универсальный 4п-спектрометр, основанный на современных технологиях. Общее количество каналов регистрации в установке SPD составляет около 500000. С учетом ожидаемой максимальной частоты возникновения интересующих взаимодействий пучков частиц около 3 МГц, суммарный поток данных с детектора можно оценить как 20 ГБ / с, что эквивалентно 200 ПБ/год (для эксперимента предполагается выделить 30% пучкового времени коллайдера). Сбор, обработка и хранение такого объема данных представляет собой серьезную проблему для вычислительной инфраструктуры эксперимента и требует разработки новых методов и подходов для реконструкции событий, моделирования и физического анализа данных с использованием высокопроизводительных и распределенных вычислений.
Существенный объем получаемых с детектора данных не будет являться практически значимым для конкретного физического исследования, однако применение методики отбора данных по триггерному сигналу не применимо к детектору SPD ввиду его конструктивных особенностей. Для решения задачи первоначальной подготовки и фильтрации данных ведется разработка специализированной вычислительной системы SPD Online Filter. Для разработки данной системы необходимо учитывать, что процессы обработки данных являются многоступенчатыми: необходимо выявлять «события» в полученных с DAQ данных, фильтровать события по заданным критериям, оптимизировать данные для обработки, передачи и хранения и т.д.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В результате получен сервис, позволяющий задавать шаблоны цепочек обработки данных, запускать в параллельном режиме цепочки обработки данных, а также отслеживать их состояние. Разрабатываемая система управления процессом обработки данных является важной компонентой всей системы SPD Online Filter и требует дальнейшей доработки.
В дальнейшем планируется доработка данной системы.


[1] Эксперимент SPD [Электронныйресурс] //URL: http://spd.jinr.ru/wp-content/uploads/2021/04/SPD_Korzenev_DIS2021.pdf
[2] NICA [Электронныйресурс] //URL: https://nica.jinr.ru/ru/
[3] CWL [Электронныйресурс] //URL: https://www.commonwl.org
[4] V.M. Abazov, V. Abramov, L.G. Afanasyev, «Conceptual design of the Spin
Physics Detector» [Электронный ресурс] // URL: https://arxiv.org/abs/2102.00442
[5] F Barreiro, M. Borodin, K. De, D. Golubkov, A. Klimentov, T. Maeno, R. Mashinistov, S.Padolski, T. Wenaus, «ATLAS production system», 2016
[6] G. Aad, E. Abat, J. Abdallah, A. Abdelalim, A. Abdesselam, O. Abdinov, B. Abi, M. Abolins, H. Abramowicz. «The ATLAS experiment at the CERN large hadron collider Journal of Instrumentation», vol. 3, no. 08, p. S08003, 2008
[7] J. Phys. Conf. Ser. 664 062035, «The future of PanDA in ATLAS distributed computing», 2015
[8] Hadron Collider J, «The ATLAS Experiment at the CERN» Inst. 3, S08003, 2008
[9] Микросервисная архитектура [Электронный ресурс] // https://www.atlassian.com/ru/microservices/microservices-architecture
[10] Apache Airflow [Электронный ресурс] // https://airflow.apache.org/
[11] Тип JSON в Postgresql [Электронный ресурс] // https://postgrespro.ru/ docs/postgresql/9.4/datatype-j son
[12] Сериализация [Электронный ресурс] // https://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D1%80%D0%B8%D0%B0%D 0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F
[13] Сериализация и десериализация объекта Python [Электронный ресурс] // https://www.techiedelight.com/ru/serialize-deserialize-python-object/
[14] RabbitMQ [Электронный ресурс] // https://www.rabbitmq.com/
[15] Сравнение Apache Kafka и RabbitMQ [Электронный ресурс] // https://habr.com/ru/companies/southbridge/articles/666326/
... всего 19 источников


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ