Введение 3
Постановка задачи 6
Обзор литературы 7
Глава 1. Применение машинного обучения для идентификации частиц 9
1.1 Формализация задачи 9
1.2 Задача классификации 15
1.3 Практический пример 18
Заключение к Главе 1 26
Глава 2. Оптимизация строения детекторов в экспериментах физики высоких энергий 27
2.1 Постановка задачи 27
2.2 Нормальное распределение 28
2.3 Гауссовские процессы в задаче регрессии 29
2.4 Байесовская оптимизация 31
2.5 Практический пример 33
Заключение к Главе 2 42
Выводы 42
Заключение 44
Список литературы 45
На сегодняшний день одной из передовых научных областей является физика элементарных частиц. Данное направление стоит на рубеже научных открытий и имеет огромный потенциал для исследований. В данной области задействованы инновации в физике, информатике, математике, приборостроении. Главными научными целями данной деятельности являются создание и совершенствование накопительных и ускорительных установок, систем для получения транспортировки пучков заряженных частиц, а также прикладные использования, такие как лечение раковых заболеваний [1], разработка новых материалов, поиск темной материи во Вселенной и другие. В физике элементарных частиц исследуются фундаментальные вопросы нашей Вселенной, понимание которых объяснит механизм нашего мира, чтобы мы могли лучше понять, где мы находимся и как это место структурировано. Эти знания могут позволить людям повысить уровень жизни с помощью технологий, которые мы используем ежедневно.
В настоящее время множество организаций и международных коллабораций таких как, Европейская организация по ядерным исследованиям (ЦЕРН) [2] или Объединенный институт ядерных исследований (ОИЯИ) [3], ведут работы над проектами физики элементарных частиц, самым масштабным среди которых является Большой адронный коллайдер (Large Hadron Collider, LHC) [4]. Это огромная арена для изучения различных моделей, стремящихся к лучшему объяснению Вселенной. LHC представляет собой туннель в форме кольца длиной 27 километров и глубиной от 50 до 175 метров, в котором протоны ускоряются до скорости, почти сопоставимой со скоростью света. Каждую секунду в туннеле сталкиваются 40 миллионов сгустков протонов, а энергия столкновения этих протонов достигает 14 тераэлектронвольт. Вокруг кольца расположены четыре больших детектора, которые называются ALICE [5], ATLAS [6], CMS [7] и LHCb [8]. Каждый детектор генерирует огромные объемы данных, сотни петабайт, для последующего анализа данных.
По своей конструкции, LHC — это машина для разрушения протонов и изучения полученных результатов. Сначала создаются протоны из атомов водорода, которые ускоряются до скорости, почти равной скорости света. Затем эти протоны группируются в сгустки, которые сталкиваются между собой. Из энергии этого столкновения появляется множество частиц, которые называются событиями. Затем детектор, который находится вокруг места столкновения, записывает информацию об энергии, которая выделяется каждой частицей, вылетающей из события. После этого начинает действовать алгоритм, который пытается восстановить траектории различных частиц и определить их типы. Изображения отдельных траекторий объединяются в узлы, и формируется структура всего события. Затем строится карта событий, и фильтруются для дальнейшего анализа только те события, которые имеют какое-то значение с физической точки зрения.
На сегодняшний день проведение подобных исследований невозможно без развитой ИТ-инфраструктуры, в том числе специализированного программного обеспечения, которое используется для моделирования столкновений элементарных частиц, трекового анализа и восстановления событий, обработки и визуализации экспериментальных данных и т.д. За последние десятилетия в области физики пучков было разработано много программных пакетов (COSY Infinity [9], MAD [10], Genie [11], PYTHIA [12], GEANT4 [13] и другие) и библиотек [14] (ACCSIM, AIM, ICE, PAC, SIMBAD, SXF, TEAPOT, ZLIB). При проведении вычислительного эксперимента часто требуется провести численное моделирование рассматриваемой задачи различными методами и способами, чтобы определить оптимальное решение, проанализировать систему с разных сторон, оценить производительность и затраты. Актуальной задачей на сегодняшний день является объединение и совместное использование различных программ, унификация форматов входных данных. Про концепцию такого универсального программного комплекса, который предназначен решить подобные проблемы, можно ознакомиться в данных работах [15], [16].
Современные исследования в физике элементарных частиц являются дорогостоящими, ресурсоемкими и высокотехнологичными процессами. Проведение подобных исследований в настоящее время сильно зависит от методов машинного обучения и интеллектуального анализа данных. В данной работе будет продемонстрировано применение таких методов машинного обучения, как градиентный [17] и адаптивный [18] бустинг, в решении задачи классификации частиц и Байесовская оптимизация [19] с Гауссовскими процессами [20] для оптимизации строения детектора.
Данное исследование является продолжением предыдущей научной деятельности в бакалавриате и магистратуре и посвящено применению машинного обучения и интеллектуального анализа данных в задачах ускорительной физики. Основные результаты исследования:
• Рассмотрены основные этапы сбора и анализа данных, которые происходят в экспериментах Большого адронного коллайдера.
• Описаны различные системы детекторов, как они работают, и какие параметры частиц измеряют.
• Определен спектр задач физики элементарных частиц, которые могут быть эффективно решены методами машинного обучения.
• Решена задача идентификации частицы с помощью таких методов машинного обучения, как градиентный и адаптивный бустинг. Результаты вычислений приведены в данной работе. На основании полученных результатов выбран наиболее точный классификатор.
• Решена задача оптимизации структуры детекторной системы с помощью методов Байесовской оптимизации с Гауссовскими параметрами, поиска по сетке и случайного поиска. Результаты вычислений приведены в данной работе. На основании результатов оптимизации выбрана наилучшая модель.
Полученные результаты и используемые подходы машинного обучения могут быть применимы в решении задач из различных предметных областей: банковская сфера, торговля товарами и услугами, социальные сети и т.д.
В заключении автор выражает благодарность за наставления и помощь в написании данной работы своему научному руководителю, доктору физико-математических наук, профессору С.Н.Андрианову.