Введение 3
Постановка задачи 5
Обзор литературы 10
Глава 1. Методы распознавания образов 11
1.1. Two-Stage методы 11
1.2. One-Stage методы 12
Глава 2. Применение методов глубокого обучения 16
2.1. Подготовка данных 17
2.2. Tensorflow 18
2.3. PyTorch 23
Глава 3. Постобработка изображений и детектирование в реальном времени 25
3.1. Алгоритм предварительной обработки изображений 25
3.2. Система детектирования в реальном времени 26
Глава 4. Встройка системы детектирования в систему управления Tango
Controls 28
Выводы 30
Заключение 31
Список литературы 32
В современном мире информационные технологии и искусственный интеллект все глубже проникают во все сферы жизни. Одной из крупных сфер в информационных технологиях является компьютерное зрение.
Компьютерное зрение - это область искусственного интеллекта (ИИ), которая стремится расширить возможности компьютеров по идентификации и определению объектов и людей на изображения и видео. Как и другие типы ИИ, компьютерное зрение ориентируется на выполнение и автоматизацию задач, имитирующих человеческие способности. Компьютерное зрение использует входные данные с сенсорных устройств, возможности ИИ, машинного обучения и глубокого обучения. В современных приложениях компьютерного зрения все чаще видна тенденция в сторону использования методов глубокого обучения. По сравнению с обычными (статистическими) методами глубокое обучение позволяет делать более точный анализ. Тем не менее статистические методы хорошо справляются с рядом определенных задач.
Сфер применения компьютерного зрения огромное количество. Среди них:
• Медицина [14]. Эта сфера характеризуется анализом изображений и постановки диагноза пациентам. Примером информации, полученной из такого рода изображений, является обнаружение опухолей, измерение органов, предоставление о строении мозга и т.д.
• Безопасность. Компьютерное зрение применимо для системы контроля доступа на основе распознавания лиц [18]: от офисов компаний до разблокировки смартфонов.
• Транспорт.
• Извлечение текста. Оптическое распознавание символов используется для обнаружения содержимого в данных с большим объемом текста, а также для автоматизации обработки текстовых документов.
В физике пучков заряженных частиц задача распознания образов и цифровой обработки изображений наиболее часто возникает при измерениях фазового объема пучка на выходе источников частиц и настройке каналов транспортировки пучков в случаях, когда чувствительным элементом датчика положения пучка является люминесцентный экран. Обычно форма пучка заранее известна с хорошей точностью, поэтому задача оцифровки изображения может быть решена и без применения методов компьютерного зрения. Ситуация меняется в случае импульсного режима работы источника частиц или ускорителя, когда информацию необходимо получить в промежутке между импульсами. Благодаря высокому быстродействию при незначительной потери точности алгоритмы распознавания образов становятся конкурентоспособными. Кроме того, при разработке конкретного приложения можно использовать достаточно отработанные на других задачах библиотеки, что существенно сокращает и срок создания готового продукта.
В результате выполнения данной работы была разработана система компьютерного зрения, способная по изображению пучка частиц на люминофоре определять его форму и считать геометрические параметры формы, а также передавать эти параметры в систему управления Tango Controls. Было достоверно продемонстрировано, что обученные модели обеспечивают быстродействие и разрешение, необходимые для автоматизации процедуры настройки канала перевода пучка из Бустера в Нуклотрон комплекса NICA. Тестирование отдельных элементов системы, набор данных для обучения были проведены в ходе работы ускорительного комплекса в феврале-марте 2022 года. Внедрение разработанной системы запланировано на ближайший сеанс работы, проведение которого намечается в сентябре - октябре 2022 года.
Исходный код разработанного программного обеспечения доступен в GitHub по ссылке [26].