Введение 3
Цель и задачи 4
Обзор литературы 5
Глава 1. Искусственные нейронные сети 6
1.1. Модель искусственного нейрона 8
1.2. Сети прямого распространения 8
1.2.1. Многослойный персептрон 9
1.2.2. Обратное распространение ошибки 10
1.2.3. Свёрточные нейронные сети 13
1.3. Сети с обратными связями 13
1.3.1. LSTM 13
1.3.2. GRU 14
Глава 2. Постановка задачи. Описание набора данных 16
2.1. Набор данных и постановка задачи 16
2.2. Метрики обучения 17
2.3. Предобработка данных 18
2.4. Параметры обучения 19
2.5. Проблема переобучения сетей 20
Глава 3. Вычислительный эксперимент. Выводы 21
3.1. Выбранные параметры 21
3.2. Валидационное множество 21
3.3. Уверенность (confidence) 22
3.4. Реализованные архитектуры 22
3.4.1. LeNet-5 22
3.4.2. VGG 23
3.4.3. Сеть с LSTM ячейками 25
3.4.4. Сеть с GRU ячейками 25
3.5. Вычислительный эксперимент 26
3.6. Выводы 29
Заключение 30
Список литературы
Распознавание изображений имеет множество сфер применения, таких как видеонаблюдение (распознавание лиц), машинный перевод (перевод текстов с одного языка на другой), маркетинг (анализ изображений товаров), медицина (распознавание заболеваний на снимках), беспилотные автомобили (распознавание объектов на видео), поисковые системы и многие другие.
В настоящее время для распознавания изображений преимущественно используются искусственные нейронные сети. Они представляют из себя некоторую программно-реализуемую вычислительную модель, которая способна обрабатывать данные и на их основе обучаться решать поставленную ей задачу.
В 2010 году начался проект ImageNet Large Scale Visual Recognition Challenge (ILSVRC). В рамках которого разработчики ежегодно соревнуются в классификации изображений базы данных ImageNet. По состоянию на август 2017 года ImageNet состоит из более чем 14 миллионов изображений, разбитых на более чем 21 тысячу классов. Если в 2011 году лучшая верность предсказаний для задачи распознавания ImageNet составляла всего 50.9%, то на данный момент она составляет уже 88.5%. Это демонстрирует стремительные темпы развития в данной области.
Выпускная квалификационная работа состоит из введения, трёх глав, заключения и списка использованной литературы.
В первой главе приведены некоторые теоретические сведения, подводящие к понимаю искусственных нейронных сетей. В ней рассмотрены основные понятия, которые использованы при описании моделей распознавания.
Во второй главе раскрыта постановка задачи распознавания изображений. В ней также приведена информация про набор данных, его предобработку, а также некоторая информация про гиперпараметры обучения и метрики.
Третья глава посвящена вычислительному эксперименту. В этой главе описываются полученные результаты и проводится их анализ.
Формулируются выводы.
В заключении подводятся итоги проделанной работы.
Цель и задачи.
Данная работа посвящена решению задачи распознавания изображений с использованием искусственных нейронных сетей. Для распознавания был выбран набор изображений CIFAR-10, состоящий из 60 000 цветных изображений, принадлежащих 10-ти непересекающимся классам. Целью работы будет являться реализация нейронных сетей, способных, обучившись на одной части изображений, правильно классифицировать вторую часть набора.
Задачи:
1. Предобработка изображений набора.
2. Реализация нескольких архитектур искусственных нейронных сетей
3. Обучение сетей распознаванию набора изображений CIFAR-10.
4. Анализ и сравнение полученных результатов.
Таким образом, при выполнении данной работы были выполнены следующие задачи:
1. Предобработка набора изображений CIFAR-10.
2. Реализация четырех архитектур искуственных нейронных сетей: LeNet-
5, VGG, LSTM и GRU.
3. Обучение сетей распознаванию набора изображений CIFAR-10 с перебором различных параметров обучения.
4. Анализ и сравнение полученных результатов.
1. Орельен Жерон. Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем / / пер. с англ. - СПб.: ООО «Альфа-книга», 2018. - 688 с.
2. Умберто Микелуччи. Прикладное глубокое обучение. Подход к понимаю глубоких нейронных сетей на основе метода кейсов. / / пер. с англ. - СПб.: БХВ-Петербург, 2020. - 368 с.
3. Бхарат Рамсундар, Реза Босаг Заде. TensorFlow для глубокого обучения. От линейной регрессии до обучения с максимизацией подкрепления. / / пер. с англ. - СПб.: БХВ-Петербург, 2019. - 256 с.
4. Антонио Джулли, Суджит Пал. Библиотека Keras - инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / / пер. с англ. - М.: ДМК Пресс, 2018. - 294 с.
5. Николенко С., Кадурин Е., Архангельская А. Глубокое обучение. Погружение в мир нейронных сетей. - СПб, 2018. - 480 с.
6. Джулли А, Пал С. Библиотека Keras - инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / / пер. с англ. М.: ДМК Пресс, 2018. - 294 с.
7. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных / / пер. с англ. М.: ДМК Пресс, 2015. - 400 с.
8. Шолле Ф. Глубокое обучение на Python / / пер. с англ. СПб.: Питер, 2018.
- 400 с.
9. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение. - Москва: ДМК-Пресс, 2017. - 652 с.
10. An overview of gradient descent optimization algorithms, https://ruder.io/optimizing-gradient-descent/index.html.
11. Траск Э. Грокаем глубокое обучение / / пер. с англ. СПб.: Питер, 2019. - 352 с.
12. Джоши, Пратик. Искусственный интеллект с примерами на Python / / пер. с англ. - СПб.: ООО «Диалектика», 2019. - 448 с.