ВВЕДЕНИЕ 3
ГЛАВА I. ТЕХНОЛОГИИ, ПРИМЕНЯЕМЫЕ В КОМПЬЮТЕРНОМ
РАСПОЗНАВАНИИ ОБЪЕКТОВ 5
1.1. Основные понятия о распознавании объектов и направления его
использования 5
1.2. Сверточная нейронная сеть 6
1.3. Примеры приложений, распознающих образы по фотографии 8
ГЛАВА II. РАЗРАБОТКА ПРИЛОЖЕНИЯ РАСПОЗНАВАНИЯ
ДОСТОПРИМЕЧАТЕЛЬНОСТЕЙ ПО ФОТОГРАФИИ 11
2.1. Концепция проекта 11
2.2. Сбор изображений для обучения и тестирования свёрточной нейронной сети 13
2.3. Средства разработки 16
2.4. Составление и обучение модели свёрточной нейронной сети 18
2.5. Графический интерфейс пользователя 23
2.6. Направления дальнейшей работы 26
ЗАКЛЮЧЕНИЕ 28
СПИСОК ЛИТЕРАТУРЫ 29
ПРИЛОЖЕНИЯ
Актуальность. Одной из передовых областей информатики является машинное обучение. Распознавание объектов на изображении с помощью алгоритмов машинного обучения решает многие задачи гораздо эффективнее, чем человеческое зрение. Так, свёрточные нейронные сети нашли широкое применение в задачах классификации, детектирования и распознавания изображений. Постепенно круг этих задач расширяется, поэтому не теряет актуальности разработка новых архитектур, слоёв сети и модификаций фреймворков. В данной работе реализовано приложение, распознавания достопримечательностей Казани по фотографии с предоставлением информации об объекте съёмки. Актуальность работы также связана с тем, что с каждым годом увеличивается поток туристов в наш город, многие из которых любят ходить на экскурсии без экскурсоводов. Разработанное приложение может помочь им узнать подробную информацию о достопримечательностях, в которых (или возле которых) они побывали.
Целью работы явилось создание приложения для распознавания достопримечательностей города Казани.
Для реализации указанной цели в работе поставлены и решены следующие задачи:
- описать основные понятия о распознавании объектов;
- описать сверточную нейронную сеть, как один из инструментов распознавания изображений;
- разработать концепцию проекта;
- собрать изображения достопримечательностей Казани, провести по ним обучение и тестирование свёрточной нейронной сети;
- составить модель свёрточной нейронной сети;
- реализовать программу с графическим интерфейсом пользователя в которой будет использоваться обученная модель, провести ее тестирование.
Структура работы. Выпускная квалификационная работа состоит из ведения, двух глав, заключения, списка используемой литературы и приложения. Первая глава носит теоретический характер - здесь приводятся основные понятия и направления использования распознавания объектов; дается обзор некоторых приложений, в которых реализовано распознавание объектов. Описывается сверточная нейронная сеть. Во второй главе всесторонне освещается разработка приложения распознавания достопримечательностей Казани. В заключении подводятся краткие итоги работы. В приложении приводится листинг.
Итогом выпускной работы является кроссплатформенная программа, состоящая из обученной модели свёрточной нейронной сети, для распознавания достопримечательностей города Казань, с графическим интерфейсом пользователя.
При работе над программой был получен новый опыт использования библиотек для обучения искусственных нейронных сетей и глубокого обучения.
Все поставленные цели и задачи выполнены.
1. Итоги работы Государственного комитета Республики Татарстан по туризму за 2017 год [Текст] / Государственный комитет Республики Татарстан по туризму, 2017. — 68 с.; То же [Электронный ресурс]. — Режим доступа: http://tourism.tatarstan.ru/rus/file/pub/pub_1257751.pdf
2. Горбань А.Н. Обучение нейронных сетей. — М.: СССР-США СП «Параграф», 1990. — 160 с.
3. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение = Deep Learning. — М.: ДМК-Пресс, 2017. — 652 с. — ISBN 978-5-97060-554¬7.
4. Джулли А., Пал С. Библиотека Keras — инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow = Deep learning with Keras. — ДМК-Пресс, 2017. — 294 с. — ISBN 978-5-97060-573-8.
5. Орельен Жерон. Прикладное машинное обучение с помощью Scikit- Learn и TensorFlow. Концепции, инструменты и техники для создания интеллектуальных систем = Hands-On Machine Learning with Scikit- Learn and TensorFlow: Concepts, Tools, and Techniques for Building Intelligent Systems. — Вильямс, 2018. — 688 с. — ISBN 978-5-9500296-2-2, 978-1-491-96229-9.
6. Шолле Ф. Глубокое обучение на Python. — Питер, 2018. — 400 с. — ISBN 978-5-4461-0770-4.
7. John E. Grayson. Python and Tkinter Programming. — Manning Publications, 1999. — 658 p. — ISBN 9781884777813.
8. Cai, H. Q. Wu, Corradi T., and Hall P.. The crossdepiction problem: Computer vision algorithms for recognizing objects in artwork and in photographs. arXiv preprint arXiv:1505.00110, 2015
9. LeCun Y., Boser B., Denker J. S., Henderson D., Howard R. E., Hubbaдщлrd and L. D. Jackel: Backpropagation Applied to Handwritten Zip Code Recognition, Neural Computation, 1(4):541-551, Winter 1989.
10. Создано приложение, которое распознает растения и изображения по
фото. URL: https://livingintravels.com/sozdano-prilozhenie-kotoroe-
raspoznaet-rasteniya-i-zhivotnyx-po-foto/
11. Приложение CamFind. URL:http: //www. webowed.net/biblioteka/15/1043/
12. Приложение What Dog. URL: https://tjournal.ru/22894-microsoft-
vypustila-prilozhenie-dlya-opredeleniya-porody-sobak-po-foto