Тип работы:
Предмет:
Язык работы:


Детекция фотографии на изображении документа

Работа №11739
Тип работыГлавы к дипломным работам
Предметгосударственное и муниципальное управление
Объем работы59 стр.
Год сдачи2016
Стоимость1200 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено 527
Не подходит работа?

Узнай цену на написание

Введение…………………………………………………………. 13
1 Аналитический обзор методов оптического распознавания
символов.........................................................................................
14
1.1 Введение в предметную область………………………………. 14
1.2 Обзор систем оптического распознавания изображений…….. 17
1.2.1 ABBYY FineReader……………………………………………... 18
1.2.2 SimpleOCR………………………………………………………. 18
1.2.3 FreeOCR………………………………………………………….. 19
1.2.4 Microsoft Office Document Imaging…………………………….. 19
1.2.5 OCRFeeder……………………………………………………….. 20
1.3 Сравнения систем оптического распознавания изображений.. 21
1.4 Анализ методов распознавания………………………………... 23
1.4.1 Методы, основанные на шаблонах…………………………….. 24
1.4.2 Методы с использованием контурных моделей………………. 26
1.4.3 Нейросетевые методы…………………………………………... 27
1.4.4 Метод Виолы-Джонса…………………………………………... 29
1.4.5 Алгоритм k ближайших соседей……………………………….. 29
1.5 Требования к разрабатываемому алгоритму………………….. 33
1.6 Заключение по аналитическому обзору……………………….. 34
2 Алгоритм распознавания текста……………………………...... 37
2.1 Общее решение задачи…………………………………………. 37
2.2 Структурная схема и описание алгоритма……………………. 38
2.3 Методы цифровой обработки изображений………………….. 40
2.4 Выделение фотографии………………………………………… 42
2.5 Сегментация изображения……………………………………... 43
2.6 Секторизация текстовых блоков……………………………….. 44
2.7 Классификация сегментов текстовых блоков………………… 45
3 Разработка программного обеспечения……………………….. 46
3.1 Общие сведения…………………………………………………. 46
3.2 Прототип программного обеспечения………………………… 47
3.2.1 Функциональные требования…………………………………... 47
3.2.2 Логическая структура…………………………………………... 48
3.2.3 Входные данные………………………………………………… 51
3.2.4 Выходные данные………………………………………………. 52
3.2.5 Графический интерфейс пользователя………………………… 52
4 Результаты проведенного исследования………………………. 55
4.1 Описание представленных экспериментов……………………. 55
4.2 Полученные экспериментальные данные……………………... 56
4.3 Сравнительный анализ k ближайших соседей………………... 57
4.4 Выводы из результатов экспериментов……………………….. 59
Заключение……………………………………………………… 101
Список источников……………………………………………... 103


Объектом исследования является процесс детектирования и
распознавания текста на изображении, а также задача детекции фотографии
на изображении документа.
Целью работы является исследование задачи оптического распознавания
изображений и реализация системы распознавания текста на документах,
удостоверяющих личность гражданина Казахстана.
В процессе исследования проводился аналитический обзор
существующих технических и программных систем, использующих
оптические методы для распознавания символов. Проведён анализ
существующих алгоритмов распознавания символов. Предложен
собственный алгоритм распознавания символов, основанный на применении
метода k ближайших соседей.
В результате исследования и применения предложенного алгоритма
удалось решить задачу распознавания символов на документах и достигнуть
приемлемой точности.
Сам процесс оптического распознавания символов ускорит ввод
персональных данных о гражданах в местные системы и базы данных, а
также поможет избежать графических ошибок, которые могут совершить
сотрудники той или иной компании, в которой система будет применяться.
Что позволит увеличить производительность как минимум в 2,5 раза.
Областью применения разработанного алгоритма являются
программные системы, задачи которых связаны с вводом, поиском и
идентификацией гражданских лиц, учётом пропуска через контрольнопропускные пункты, ограничением входа на частную территорию.
В будущем планируется модернизация эффективности работы
алгоритма, с целью улучшения выходных показателей.

Актуальность работы. Задача распознавания содержимого
документов, удостоверяющих личность, достаточно востребована при
реализации программных систем таможенного контроля,
правоохранительных органов, банков с целью автоматизации процесса
определения личности человека посредством сканирования и распознавания
документов. Системы могут размещаться в пунктах таможенного контроля,
участковых отделах полиции и т.д.
Целью магистерской диссертации является исследование задачи
оптического распознавания изображений и реализация системы
распознавания документов, удостоверяющих личность гражданина
Казахстана.
Объектом исследования работы является процесс детектирования и
распознавания текста на изображении, а также задача определения
фотографии на изображении документа.
Предметом исследования в рамках выпускной квалификационной
работы является задача распознавания содержимого документов,
удостоверяющих личность гражданина Казахстана.
Научная и практическая новизна заключается в разработке и
реализации алгоритма распознавания содержимого документов
удостоверяющих личность гражданина Казахстана, а также определении
местоположении фотографии на изображении документа.
Практическая значимость результатов ВКР. Результаты выпускной
квалификационной работы могут быть использованы с целью поиска
конкретного человека, быстрого автоматизированного определения личности
с использованием базы документов.
Реализация и апробация работы. Планируется внедрение в опытную
эксплуатацию разработанной системы распознавания документов,
удостоверяющих личность, в пунктах контроля.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании студенческих
и аспирантских работ!


Задача ˋ автоматизированного ˋраспознавания документов,
удостоверяющих ˋличность, в настоящее ˋ время ˋпока еще ˋне решена ˋв полной
ˋмере, в виду чего ˋона ˋ является ˋодной из наиболее ˋ актуальных ˋзадач
распознавания ˋ данных.
Системы распознавания ˋ документов ˋпризваны для ˋупрощения ˋ работы
ˋсотрудников таможенного ˋ контроля, органов МВД, сотрудников ˋбанков и
т.д., а также ˋ для ˋснижения вероятности ˋ возникновения ˋчеловеческой
ошибки, определения ˋподлинности документа, а также ˋавтоматизации
процесса ˋпоиска ˋ личности по базам ˋ данных.
Выбранная область ˋ разработки ˋсама по себе ˋ является ˋуникальной т.к.
не существует ˋаналогов систем ˋ оптического ˋраспознавания изображений ˋ
предназначенных ˋдля ˋдокументов, удостоверяющих ˋ личность ˋграждан
Республики ˋ Казахстан, на что ˋи делается основной ˋупор ˋ при ˋнаписании
выпускной ˋ квалификационной ˋработы.
Существующие ˋсистемы ˋраспознавания не позволяют ˋв полной ˋмере
просканировав ˋ какой ˋ- либо официальный ˋ документ, определить ключевые ˋ
данные, содержащиеся в документе, выделить ˋфотографию гражданина ˋи
сохранить ˋданные в базе. Как ˋ правило ˋто, что ˋсуществует на сегодняшний ˋ
день, больше предназначено ˋ для ˋпростого ˋперевода текстовых ˋ документов ˋв
электронный формат ˋ (например, для ˋперевода книг).
В рамках ˋВКР ˋвыполнен аналитический ˋ обзор ˋсуществующих систем ˋи
методов ˋоптического ˋраспознавания ˋданных, проведен ˋих сравнительный
ˋанализ, выявлены ˋ основные ˋнедостатки, обоснована необходимость ˋ
разработки ˋсистемы.
Анализ ˋ различных ˋметодов распознавания ˋ данных ˋпозволил понять ˋ
проблемы, существующие в данной ˋ области ˋи выявить области ˋ применения
ˋразличных методов, их достоинства ˋи недостатки в применении ˋк решению
ˋразличных задач.Упомянуты ˋосновные методы, на которых ˋстроятся системы ˋ
распознавания ˋданных. Проведен ˋ сравнительный ˋанализ результатов ˋ
распознавания ˋданных при ˋразличных ˋ параметрах ˋвыбранного метода ˋk
ближайших ˋсоседей. Данный ˋанализ ˋпозволяет сделать ˋвывод ˋо наиболее
удачных ˋ значениях ˋпараметра для ˋрешения ˋ поставленной ˋзадачи.
Разработанный ˋалгоритм ˋраспознавания документов, удостоверяющих
ˋличность, позволяет ˋ достичь ˋточности распознавания ˋ до 83,1%. Результаты
были ˋполучены ˋ на тестовых образцах ˋ документов.
Для ˋдемонстрации ˋ предложенного ˋрешения распознавания ˋ данных
ˋразработан прототип ˋ системы, представляющий собой ˋ веб-ориентированное
ˋприложение, имеющее ˋдоступ ˋ к веб-камере клиентского ˋ устройства.
Архитектура разработанной ˋ системы ˋпозволяет вносить ˋ изменения ˋв
алгоритм и в систему, не нарушая ˋее общей работоспособности ˋи
целостности ˋее компонент.


Паспорт гражданина ˋ Казахстана ˋ[Электронный ресурс] – Режим ˋ
доступа:http://ru.wikipedia.org/wiki/Удостоверение_личности_гражданина_Ка
захстана
2. OCR System FineReader by ABBY [Электронный ˋресурс] – Режим ˋ
доступа: https://ru.wikipedia.org/wiki/ABBYY_FineReader
3. ABBY FineReader [Электронный ресурс] – Режим доступа:
http://www.abbyy.ru/finereader/
4. Распознавание ˋтекста ˋна изображениях [Электронный ˋ ресурс] –
Режим доступа: http://ria.ru/science/20130711/949012277.html
5. Компания ˋABBY [Электронный ˋресурс] – Режим доступа:
https://ru.wikipedia.org/wiki/ABBYY
6. SimpleOCR system [Электронный ˋресурс] – Режим доступа:
http://freeanalogs.ru/SimpleOCR
7. Новый ˋобразец удостоверения ˋ личности ˋгражданина Казахстана ˋ
[Электронный ˋресурс] – Режим ˋ доступа:
http://www.kt.kz/rus/government/praviteljstvo_kazahstana_utverdilo_novie_obraz
ci_udostoverenija_lichnosti_dlja_grazhdan_rk_i_vida_na_zhiteljstvo_dlja_inostran
cev_1153495663.html
8. OCRFeeder system [Электронный ˋресурс] – Режим ˋдоступа:
https://wiki.gnome.org/action/show/Apps/OCRFeeder?action=show&redirect=OC
RFeeder
9. OCRFeeder system source code[Электронный ˋ ресурс] – Режим
доступа: https://github.com/GNOME/ocrfeeder
10. Free-OCR system [Электронный ˋресурс] – Режим доступа:
http://www.free-ocr.com/
11. Распознавание ˋтекста с помощью ˋFree-OCR [Электронный
ресурс] – Режим ˋ доступа: https://besplatnyeprogrammy.net/ofis/raspoznavanieteksta/freeocr12. Free OCR - распознавание ˋтекста [Электронный ˋ ресурс] – Режим
доступа: http://pro-spo.ru/textl/2534-free-ocr
13. Поддержка ˋрусского языка ˋв Tesseract-OCR [Электронный
ресурс] – Режим ˋ доступа: http://www.nixp.ru/news/10755.html
14. Tesseract-OCR source code [Электронный ˋресурс] – Режим
доступа: https://github.com/tesseract-ocr
15. Microsoft Office Document Imaging [Электронный ресурс] –
Режим доступа:
https://ru.wikipedia.org/wiki/Microsoft_Office_Document_Imaging
16. Установка ˋMODI совместно с MS Office 2010 [Электронный
ресурс] – Режим ˋ доступа: https://support.microsoft.com/ru-ru/kb/982760
17. Cистемы ˋоптического ˋраспознавания текста ˋ [Электронный
ˋресурс] – Режим ˋ доступа: http://old.ci.ru/inform16_02/p_22text.htm
18. Смирнов С.В. СПИИиА ˋРАН ˋ г. Санкт-Петербург. Критерии
ˋоценки ˋ качества оптического ˋ распознавания.
19. Antonacopoulos, C. Clausner, C. Papadopoulos and S. Pletschacher.
ICDAR2013 Competition on Historical Book Recognition. – HBR2013, 2013.
20. Сравнение ˋсистем оптического ˋ распознавания ˋ[Электронный
ресурс] – Режим ˋ доступа:
https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_softw
are
21. Лучшие ˋOCR-системы ˋ[Электронный ресурс] – Режим ˋ доступа:
https://winbeginner.com/the-best-ocr-software
22. Считывание ˋштриховых ˋкодов [Электронный ˋ ресурс] – Режим
доступа: http://www.pcmag.com/article2/0,2817,2424075,00.asp
23. Ф. Розенблатт. Принципы нейродинамики. Перцептроны ˋи теория
механизмов ˋ мозга. Издательство: Мир.1965 г.
24. Вапник ˋВ.Н., Червоненкис ˋ А.Я. Теория распознавания ˋ образов.
М,: Наука, 1974.25. Потапов ˋА.С. Распознавание ˋ образов ˋи маши

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


© 2008-2022 Cервис помощи студентам в выполнении работ