1 Введение 3
2 Постановка задачи 4
3 Основные понятия и термины 5
4 Метод извлечения признаков изображения и их кластеризации 10
5 Результаты 16
6 Заключение 20
Список литературы 20
В данной работе рассматривается задача кластеризации данных применительно к изображениям. Целью работы является извлечение пригодных для кластеризации признаков изображения и построение на их основе хеш- множества, определяющего кластеры; полученные данные предполагается использовать как тестовое множество для обучения более сложных нейронных сетей в случаях, когда невозможно это сделать вручную в силу большого количества данных. Под изображением в данной работе понимается чёрно-белое изображение, содержащее текст, таблицы, либо другие элементы, присущие различного рода документам. Применение рассмотренных методов извлечения признаков ограничивается описанным выше содержимым изображений, в то время как рассмотренный метод кластеризации является независимым и может применяться в различных задачах, в том числе не имеющим отношения к изображениям.
В первой половине работы описывается постановка задачи, используемые для её решения понятия, определения, операции и методы. На их основе выводится алгоритм решения. Во второй половине описано решение задачи и результаты.
Нами был рассмотрен метод быстрого извлечения признаков и последующей их кластеризации на основе полученных признаков, применимый к большим наборам даннвхх. В сравнении с более сложнвхми математически методами классификации с помощвю нейросетей, даннвхй алгоритм даёт менвшую точности, однако всё же достаточную для применения его при построении тестового множества нейросети
Среди направлений дальнейших исследований можно выделить улучшение алгоритма извлечения признаков с целью более точно выделять особенности структуры текста, а также алгоритма кластеризации с целью повышения надёжности. Кроме того, увеличить точность работы алгоритма можно с помощью адаптивной кластеризации, применения более сложных алгоритмов разбиения или исследования пространства признаков на возможность применения неевклидовых метрик.
1. J. Р. F. Serra. Image analysis and mathematical morphology // Academic Press (1982).
2. Opencv documentation.
URL http://docs.opencv.org/2.4/doc/tutorials/imgproc/opening, closing.hats/opening_closing_hats.html
3. E. R. Urbach, M. H. F. Wilkinson. Efficient 2-d grayscale morphological transformations with arbitrary flat structuring elements // IEEE Transactions on Image Processing (2008) стр. 1-8.
4. P. Soille, E. J. Breen, R. Jones. Recursive implementation of erosions and dilations along discrete lines at arbitrary angles // IEEE Transactions on Pattern Analysis and Machine Intelligence (1996) стр. 562-567.
5. Z. Yu-qian, G. Wei-hua, C. Zhen-cheng, T. Jing-tian, L. Ling-yun. Medical images edge detection based on mathematical morphology // Pattern Recognition Letters (2007) стр. 6492-6495.
6. J. O’Rourke. Finding minimal enclosing boxes // International Journal of Computer and Information Sciences (1985) стр. 183-199.
7. G. Barequet, S. Har-Peled. Efficiently approximating the minimum-volume bounding box of a point set in three dimensions // Journal of Algorithms (38) (2001) стр. 91-109.
8. M. Inaba, N. Katoh, H. Imai. Applications of weighted voronoi diagrams and randomization to variance-based k-clustering // Proceedings of 10th ACM Symposium on Computational Geometry (1994) стр. 332-339.
9. A. Andoni, P. Indyk. Near-optimal hashing algorithms for approximate nearest neighbor in high dimensions // The IEEE Symposium on Foundations of Computer Science (2006) стр. 1-7,10.
10. M. Datar, N. Immorlica, P. Indyk, V. S. Mirrokni. Nearest-neighbor methods in learning and vision: Theory and practice // MIT Press (2006) стр. 221-222.