Оглавление 2
Введение 3
Постановка задачи 5
1. Формальное описание 5
2. Работа с данными 5
3. Оценка результатов 5
4. Основные этапы работы 6
Обзор литературы 7
Глава 1: Методы сегментации изображений и видео 10
1.1 Метод MSER 10
1.2 Метод выделения связных компонент 10
1.3 Графо-ориентированная сегментация 12
1.4 Метод водораздела 12
1.5 Метод глубокого обучения 14
Глава 2: Реализация и тестирование системы 18
2.1 Основная суть алгоритма 18
2.2 Выбор программных средств 18
2.3 Реализация генератора данных 19
2.4 Реализация системы отделения фона 21
2.5 Реализация сегментации объектов 22
2.6 Исследование системы 23
Заключение 26
Список литературы 27
Приложение 29
В связи со стремительным развитием мощностей вычислительной техники обработка многомерных данных большого объема стала осуществима фактически в реальном времени. Это привело к массовой автоматизации и созданию систем, способных без вмешательства человека проводить анализ и выполнять сложные действия. В последнее время популярностью пользуются автоматические системы распознавания образов, которые позволяют автоматизировать многие трудоёмкие для человека процессы. Такие системы основаны на различных алгоритмах сегментации.
Особенную сложность при сегментации представляют изображения, содержащие скопления однотипных (однородных) объектов. Большинство алгоритмов определит всю группу объектов в один большой кластер, и если данные объекты перекрываются друг с другом, то невозможно будет сказать один это объект или несколько.
Под однотипными объектами понимаются объекты имеющие одинаковую природу (состав, цвет, прочность, форму), но в некоторой степени различающиеся по контуру и размеру. Примеры таких объектов приведены на рис 1.1.
Данная задача находит применение во многих сферах:
• Медицина - сегментация клеток и метастазов на медицинских снимках (обычно имеющих огромное разрешение)
• География - сегментация крыш домов на снимках со спутника
• Промышленность - компьютерное зрение для роботов, выполняющих производственные задачи
• И многое другое
В данной работе предлагается идея алгоритма компьютерного зрения для определения среди однотипных объектов экземпляров наибольшего размера в видеопотоке, а также проведено его тестирование на сгенерированном дата сете. Такой алгоритм может применяться в реальных системах производственных предприятий и был бы полезен, например, для автоматизированного отделения больших минералов от маленьких на конвейере.
В рамках данной работы была поставлена задача: разработка системы сегментации движущихся однотипных объектов, выделяющихся по размеру. В ходе ее решения были поставлены подзадачи, описанные в пункте «основные этапы работы». В итоге были получены следующие результаты:
1) Проанализированы научные публикации по теме сегментации однородных объектов.
2) Проведен анализ методов сегментации.
3) Сгенерирован тестовый датасет для задачи отделения минералов крупного размера на конвейере.
4) Разработана система на основе проанализированных данных.
5) Проведено экспериментальное исследование системы.
Таким образом, можно утверждать, что поставленная задача решена полностью.
Стоит отметить, что в данной работе представлена реализация алгоритма под конкретную задачу, однако он может быть эффективен для более широкого круга проблем, и исследование, проведенное в данной работе, может быть продолжено.
[1] Beyond CNNs: Exploiting Further Inherent Symmetries in Medical Images for Segmentation. Shuchao Pang, Anan Du, Mehmet A. Orgun, Yan Wang, Quanzheng Sheng, Shoujin Wang, Xiaoshui Huang, Zhemei Yu
URL:https://arxiv.org/ftp/arxiv/papers/2005/2005.03924.pdf
[2] Stillleben: Realistic Scene Synthesis for Deep Learning in Robotics. Max Schwarz and Sven Behnke.
URL:https://arxiv.org/pdf/2005.05659.pdf
[3] A watershed-based algorithm to segment and classify cells in fluorescence microscopy images. Lena R. Bartell, Lawrence J. Bonassar, and Itai Cohen.
URL:https://arxiv.org/pdf/1706.00815.pdf
[4] Cell segmentation and tracking using distance transform predictions and movement estimation with graph-based matching. Tim Scherr, Katharina Loffler, Moritz Bohland, Ralf Mikut.
URL:https://arxiv.org/pdf/2004.01486.pdf
[5] POLY-YOLO: higher speed, more precise detection and instance segmentation for YOLOV3. 2020 Petr Hurtik, Vojtech Molek, Jan Hula, Marek Vajgl, Pavel Vlasanek , and Tomas Nejezchleba
URL:https://arxiv.org/pdf/2005.13243.pdf
[6] Concurrent segmentation and object detection CNNS for aircraft detection and identification in satellite images. Damien Grosgeorge, Maxime Arbelot, Alex Goupilleau, Tugdual Ceillier, Renaud Allioux
URL:https://arxiv.org/pdf/2005.13215.pdf
[7] Robust Wide Baseline Stereo from Maximally Stable Extremal Regions. J. Matas, O. Chum, M. Urban, T. Pajdla
URL:http://cmp.felk.cvut.cz/~matas/papers/matas-bmvc02.pdf
[8] Abubaker, A; Qahwaji, R; Ipson, S; Saleh, M. One Scan Connected Component Labeling Technique. Signal Processing and Communications, 2007
[9] Serge Beucher and Christian Lantuej workshop on image processing, real-time edge and motion detection (1979).
[10] Serge Beucher and Fernand Meyer. The morphological approach tosegmentation: the watershed transformation. In Mathematical Morphology in Image Processing (1993).
[11] U-Net: Convolutional Networks for Biomedical Image Segmentation. Olaf Ronneberger, Philipp Fischer, and Thomas Brox
URL:https://arxiv.org/pdf/1505.04597.pdf