Тема: Применение сверточных нейронных сетей для распознавания изображений
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Постановка задачи 5
Обзор литературы 6
Глава 1. Сверточные нейронные сети 11
1.1. Обзор сверточных нейронных сетей 11
1.1.1 Сверточный слой 13
1.1.2 Слой субдискретизации 18
1.1.3 Полносвязный слой 20
1.2 Архитектура сверточной нейронной сети 21
1.3 Известные сверточные нейронные сети 24
1.4 Выбор функции активации 27
1.5 Обратное распространение ошибки 29
1.6 Функционирование сверточной нейронной сети 32
Глава 2.Модификация сверочной нейронной сети 39
2.1. Модификация сверточной нейронной сети 39
2.2. Функционирование модифицированной сети 45
Глава 3. Реализация и результаты вычислительного эксперимента 48
3.1. Реализация сверточных нейронных сетей 48
3.1. Тестирование реализованных сверточных сетей 50
Выводы 54
Заключение 55
Список литературы 56
📖 Введение
Несмотря на существование большого числа различных алгоритмов решающих указанную задачу, на данный момент не создано эффективного программного продукта для распознавания рукописных и зашумленных текстов, подходящего для массового использования. Именно поэтому разработка новых эффективных и быстродействующих алгоритмов оптического распознавания изображений, в частности, основанных на применении искусственных нейронных сетей, до сих пор признана актуальной.
Ранее считалось, что для решения этой проблемы эффективными являются сети теории адаптивного резонанса ([2]). Отличительной особенностью нейронных сетей указанного типа является свойство стабильности-пластичности памяти. То есть сеть АРТ может как запоминать новые образы (то есть реализовывать свойство пластичности), так и сохранять некоторую неизменность уже хранящихся в памяти образов (то есть обеспечивать стабильность). Сеть АРТ сравнивает входной сигнал с ранее запомненными образами и определяет, насколько существенны различия между ними. Исходя из проведенного сравнения сеть либо модернизирует хранящийся в памяти образ, либо создает новый образ на основе входного сигала. Однако, несмотря свойство стабильности-пластичности, а также на определенный уровень биоподобия памяти, сеть АРТ-1 в силу своей архитектуры имеет ряд трудноустранимых недостатков: эффект затирания памяти, недостаточная устойчивость к искажениям и сдвигам и большое количество параметров.
Одними из самых востребованных разработок в области компьютерного зрения в последние годы стали сверточные нейронные сети. Начиная с 2012 года, когда конкурс ImageNet (ежегодная международная Олимпиада компьютерного зрения) выиграл Алекс Крижевский с модификацией сверточной нейронной сети, победителями этого конкурса вплоть до этого года являются сети, построенные на базе сверточных. Стоит отметить, что благодаря новому подходу к архитектуре сети показатель ошибки классификации был снижен с 26% до 15% в 2012, в первое появление подобной сети. В 2017 году результат сети победителя составляет 0.23%[3]. В настоящий момент множество компаний используют технологию глубокого обучения в качестве одной из фундаментальных составляющих своих услуг. Так, к примеру, Facebook использует нейронные сети для своих алгоритмов автоматической маркировки, Google для поиска фотографий, Amazon для рекомендаций своих продуктов и Instagram для организации поисковой инфраструктуры.
Постановка задачи.
В рамках магистерской диссертации поставлены следующие задачи:
1) Спроектировать и реализовать в программном коде классическую сверточную нейронную сеть.
2) Реализовать модификацию сверточной нейронной сети с использованием теории адаптивного резонанса.
3) Для написанных программ провести тестирование на задаче оптического распознавания изображений, в качестве основы использовать базу MNIST[4] и проанализировать полученные результаты.
✅ Заключение
1) На основе изученных алгоритмов спроектирована и реализована в программном коде на языке С++ классическая сверточная нейронная сеть.
2) Реализована модификация с использованием теории адаптивного резонанса, в которой увеличена скорость дообучения сети.
3) Для написанных программ проведено тестирование на задаче оптического распознавания рукописных цифр, в качестве основы использована база MNIST и приведены выводы из сравнительного эксперимента.





