Тип работы:
Предмет:
Язык работы:


Распознавание типов изображений документов

Работа №132012

Тип работы

Бакалаврская работа

Предмет

математика и информатика

Объем работы21
Год сдачи2016
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
30
Не подходит работа?

Узнай цену на написание


1 Введение 3
2 Постановка задачи 4
3 Основные понятия и термины 5
4 Метод извлечения признаков изображения и их кластериза­ции 10
5 Результаты 16
6 Заключение 20
Список литературы 20

В данной работе рассматривается задача кластеризации данных приме­нительно к изображениям. Целью работы является извлечение пригодных для кластеризации признаков изображения и построение на их основе хеш- множества, определяющего кластеры; полученные данные предполагается ис­пользовать как тестовое множество для обучения более сложных нейронных сетей в случаях, когда невозможно это сделать вручную в силу большого ко­личества данных. Под изображением в данной работе понимается чёрно-белое изображение, содержащее текст, таблицы, либо другие элементы, присущие различного рода документам. Применение рассмотренных методов извлече­ния признаков ограничивается описанным выше содержимым изображений, в то время как рассмотренный метод кластеризации является независимым и может применяться в различных задачах, в том числе не имеющим отношения к изображениям.
В первой половине работы описывается постановка задачи, используемые для её решения понятия, определения, операции и методы. На их основе вы­водится алгоритм решения. Во второй половине описано решение задачи и результаты.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Нами был рассмотрен метод быстрого извлечения признаков и последую­щей их кластеризации на основе полученных признаков, применимый к боль­шим наборам даннвхх. В сравнении с более сложнвхми математически метода­ми классификации с помощвю нейросетей, даннвхй алгоритм даёт менвшую точности, однако всё же достаточную для применения его при построении тестового множества нейросети
Среди направлений дальнейших исследований можно выделить улучше­ние алгоритма извлечения признаков с целью более точно выделять особенно­сти структуры текста, а также алгоритма кластеризации с целью повышения надёжности. Кроме того, увеличить точность работы алгоритма можно с по­мощью адаптивной кластеризации, применения более сложных алгоритмов разбиения или исследования пространства признаков на возможность приме­нения неевклидовых метрик.


1. J. Р. F. Serra. Image analysis and mathematical morphology // Academic Press (1982).
2. Opencv documentation.
URL http://docs.opencv.org/2.4/doc/tutorials/imgproc/opening, closing.hats/opening_closing_hats.html
3. E. R. Urbach, M. H. F. Wilkinson. Efficient 2-d grayscale morphological transformations with arbitrary flat structuring elements // IEEE Transactions on Image Processing (2008) стр. 1-8.
4. P. Soille, E. J. Breen, R. Jones. Recursive implementation of erosions and dilations along discrete lines at arbitrary angles // IEEE Transactions on Pattern Analysis and Machine Intelligence (1996) стр. 562-567.
5. Z. Yu-qian, G. Wei-hua, C. Zhen-cheng, T. Jing-tian, L. Ling-yun. Medical images edge detection based on mathematical morphology // Pattern Recognition Letters (2007) стр. 6492-6495.
6. J. O’Rourke. Finding minimal enclosing boxes // International Journal of Computer and Information Sciences (1985) стр. 183-199.
7. G. Barequet, S. Har-Peled. Efficiently approximating the minimum-volume bounding box of a point set in three dimensions // Journal of Algorithms (38) (2001) стр. 91-109.
8. M. Inaba, N. Katoh, H. Imai. Applications of weighted voronoi diagrams and randomization to variance-based k-clustering // Proceedings of 10th ACM Symposium on Computational Geometry (1994) стр. 332-339.
9. A. Andoni, P. Indyk. Near-optimal hashing algorithms for approximate nearest neighbor in high dimensions // The IEEE Symposium on Foundations of Computer Science (2006) стр. 1-7,10.
10. M. Datar, N. Immorlica, P. Indyk, V. S. Mirrokni. Nearest-neighbor methods in learning and vision: Theory and practice // MIT Press (2006) стр. 221-222.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ