Применение сверточных нейронных сетей для распознавания изображений
|
Введение 3
Постановка задачи 5
Обзор литературы 6
Глава 1. Сверточные нейронные сети 11
1.1. Обзор сверточных нейронных сетей 11
1.1.1 Сверточный слой 13
1.1.2 Слой субдискретизации 18
1.1.3 Полносвязный слой 20
1.2 Архитектура сверточной нейронной сети 21
1.3 Известные сверточные нейронные сети 24
1.4 Выбор функции активации 27
1.5 Обратное распространение ошибки 29
1.6 Функционирование сверточной нейронной сети 32
Глава 2.Модификация сверочной нейронной сети 39
2.1. Модификация сверточной нейронной сети 39
2.2. Функционирование модифицированной сети 45
Глава 3. Реализация и результаты вычислительного эксперимента 48
3.1. Реализация сверточных нейронных сетей 48
3.1. Тестирование реализованных сверточных сетей 50
Выводы 54
Заключение 55
Список литературы 56
Постановка задачи 5
Обзор литературы 6
Глава 1. Сверточные нейронные сети 11
1.1. Обзор сверточных нейронных сетей 11
1.1.1 Сверточный слой 13
1.1.2 Слой субдискретизации 18
1.1.3 Полносвязный слой 20
1.2 Архитектура сверточной нейронной сети 21
1.3 Известные сверточные нейронные сети 24
1.4 Выбор функции активации 27
1.5 Обратное распространение ошибки 29
1.6 Функционирование сверточной нейронной сети 32
Глава 2.Модификация сверочной нейронной сети 39
2.1. Модификация сверточной нейронной сети 39
2.2. Функционирование модифицированной сети 45
Глава 3. Реализация и результаты вычислительного эксперимента 48
3.1. Реализация сверточных нейронных сетей 48
3.1. Тестирование реализованных сверточных сетей 50
Выводы 54
Заключение 55
Список литературы 56
В настоящее время искусственные нейронные сети представляют собой бурно развивающееся направление с большими возможностями в области практического применения. Искусственные нейронные сети уже сейчас активно используются для решения таких задач как классификация и кластеризация данных, прогнозирование, аппроксимация, сжатие и архивация информации, распознавание образов и другие ([1]). Решение последней задачи, а точнее распознавание изображений, требуется во многих практических областях, например, в некоторых сферах военной деятельности, в криминалистке, робототехнике, работе органов правопорядка и других. Один из наиболее известных и востребованных для практического применения видов оптического распознавания - это распознавание зашумленных или рукописных символов (цифр и букв). Для решения подобной задачи могут быть использованы искусственные нейронные сети Хопфилда, Хемминга, сети адаптивной резонансной теории, сети двунаправленной ассоциативной памяти, многослойный персептрон, когнитрон и неокогнитрон и некоторые другие ([2]).
Несмотря на существование большого числа различных алгоритмов решающих указанную задачу, на данный момент не создано эффективного программного продукта для распознавания рукописных и зашумленных текстов, подходящего для массового использования. Именно поэтому разработка новых эффективных и быстродействующих алгоритмов оптического распознавания изображений, в частности, основанных на применении искусственных нейронных сетей, до сих пор признана актуальной.
Ранее считалось, что для решения этой проблемы эффективными являются сети теории адаптивного резонанса ([2]). Отличительной особенностью нейронных сетей указанного типа является свойство стабильности-пластичности памяти. То есть сеть АРТ может как запоминать новые образы (то есть реализовывать свойство пластичности), так и сохранять некоторую неизменность уже хранящихся в памяти образов (то есть обеспечивать стабильность). Сеть АРТ сравнивает входной сигнал с ранее запомненными образами и определяет, насколько существенны различия между ними. Исходя из проведенного сравнения сеть либо модернизирует хранящийся в памяти образ, либо создает новый образ на основе входного сигала. Однако, несмотря свойство стабильности-пластичности, а также на определенный уровень биоподобия памяти, сеть АРТ-1 в силу своей архитектуры имеет ряд трудноустранимых недостатков: эффект затирания памяти, недостаточная устойчивость к искажениям и сдвигам и большое количество параметров.
Одними из самых востребованных разработок в области компьютерного зрения в последние годы стали сверточные нейронные сети. Начиная с 2012 года, когда конкурс ImageNet (ежегодная международная Олимпиада компьютерного зрения) выиграл Алекс Крижевский с модификацией сверточной нейронной сети, победителями этого конкурса вплоть до этого года являются сети, построенные на базе сверточных. Стоит отметить, что благодаря новому подходу к архитектуре сети показатель ошибки классификации был снижен с 26% до 15% в 2012, в первое появление подобной сети. В 2017 году результат сети победителя составляет 0.23%[3]. В настоящий момент множество компаний используют технологию глубокого обучения в качестве одной из фундаментальных составляющих своих услуг. Так, к примеру, Facebook использует нейронные сети для своих алгоритмов автоматической маркировки, Google для поиска фотографий, Amazon для рекомендаций своих продуктов и Instagram для организации поисковой инфраструктуры.
Постановка задачи.
В рамках магистерской диссертации поставлены следующие задачи:
1) Спроектировать и реализовать в программном коде классическую сверточную нейронную сеть.
2) Реализовать модификацию сверточной нейронной сети с использованием теории адаптивного резонанса.
3) Для написанных программ провести тестирование на задаче оптического распознавания изображений, в качестве основы использовать базу MNIST[4] и проанализировать полученные результаты.
Несмотря на существование большого числа различных алгоритмов решающих указанную задачу, на данный момент не создано эффективного программного продукта для распознавания рукописных и зашумленных текстов, подходящего для массового использования. Именно поэтому разработка новых эффективных и быстродействующих алгоритмов оптического распознавания изображений, в частности, основанных на применении искусственных нейронных сетей, до сих пор признана актуальной.
Ранее считалось, что для решения этой проблемы эффективными являются сети теории адаптивного резонанса ([2]). Отличительной особенностью нейронных сетей указанного типа является свойство стабильности-пластичности памяти. То есть сеть АРТ может как запоминать новые образы (то есть реализовывать свойство пластичности), так и сохранять некоторую неизменность уже хранящихся в памяти образов (то есть обеспечивать стабильность). Сеть АРТ сравнивает входной сигнал с ранее запомненными образами и определяет, насколько существенны различия между ними. Исходя из проведенного сравнения сеть либо модернизирует хранящийся в памяти образ, либо создает новый образ на основе входного сигала. Однако, несмотря свойство стабильности-пластичности, а также на определенный уровень биоподобия памяти, сеть АРТ-1 в силу своей архитектуры имеет ряд трудноустранимых недостатков: эффект затирания памяти, недостаточная устойчивость к искажениям и сдвигам и большое количество параметров.
Одними из самых востребованных разработок в области компьютерного зрения в последние годы стали сверточные нейронные сети. Начиная с 2012 года, когда конкурс ImageNet (ежегодная международная Олимпиада компьютерного зрения) выиграл Алекс Крижевский с модификацией сверточной нейронной сети, победителями этого конкурса вплоть до этого года являются сети, построенные на базе сверточных. Стоит отметить, что благодаря новому подходу к архитектуре сети показатель ошибки классификации был снижен с 26% до 15% в 2012, в первое появление подобной сети. В 2017 году результат сети победителя составляет 0.23%[3]. В настоящий момент множество компаний используют технологию глубокого обучения в качестве одной из фундаментальных составляющих своих услуг. Так, к примеру, Facebook использует нейронные сети для своих алгоритмов автоматической маркировки, Google для поиска фотографий, Amazon для рекомендаций своих продуктов и Instagram для организации поисковой инфраструктуры.
Постановка задачи.
В рамках магистерской диссертации поставлены следующие задачи:
1) Спроектировать и реализовать в программном коде классическую сверточную нейронную сеть.
2) Реализовать модификацию сверточной нейронной сети с использованием теории адаптивного резонанса.
3) Для написанных программ провести тестирование на задаче оптического распознавания изображений, в качестве основы использовать базу MNIST[4] и проанализировать полученные результаты.
В рамках магистерской диссертации были решены следующие задачи:
1) На основе изученных алгоритмов спроектирована и реализована в программном коде на языке С++ классическая сверточная нейронная сеть.
2) Реализована модификация с использованием теории адаптивного резонанса, в которой увеличена скорость дообучения сети.
3) Для написанных программ проведено тестирование на задаче оптического распознавания рукописных цифр, в качестве основы использована база MNIST и приведены выводы из сравнительного эксперимента.
1) На основе изученных алгоритмов спроектирована и реализована в программном коде на языке С++ классическая сверточная нейронная сеть.
2) Реализована модификация с использованием теории адаптивного резонанса, в которой увеличена скорость дообучения сети.
3) Для написанных программ проведено тестирование на задаче оптического распознавания рукописных цифр, в качестве основы использована база MNIST и приведены выводы из сравнительного эксперимента.
Подобные работы
- Применение сверточной нейронной сети для дифференциации туберкулеза и пневмонии на цифровых рентгенограммах
Магистерская диссертация, нейронные сети . Язык работы: Русский. Цена: 5400 р. Год сдачи: 2020 - Применение сверточных нейронных сетей для локализации объектов на изображении
Магистерская диссертация, информатика. Язык работы: Русский. Цена: 4910 р. Год сдачи: 2020 - Разработка программного обеспечения для сравнения алгоритмов обучения сверточных нейронных сетей
Бакалаврская работа, нейронные сети . Язык работы: Русский. Цена: 1500 р. Год сдачи: 2021 - Информационная технология распознавания жестов для человеко-машинного
взаимодействия на базе сверточных нейронных сетей
Дипломные работы, ВКР, информационные системы. Язык работы: Русский. Цена: 4900 р. Год сдачи: 2019 - РАЗРАБОТКА ПРИЛОЖЕНИЯ ДЛЯ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ РОССИЙСКИХ ЗНАКОВ ДОРОЖНОГО ДВИЖЕНИЯ С ПОМОЩЬЮ КОМПЬЮТЕРНОГО ЗРЕНИЯ И СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ
Дипломные работы, ВКР, информационные системы. Язык работы: Русский. Цена: 4280 р. Год сдачи: 2017 - Поиск аномалий на рентгеновских снимках с помощью сверточных нейронных сетей
Бакалаврская работа, нейронные сети . Язык работы: Русский. Цена: 4700 р. Год сдачи: 2020 - Алгоритмы анализа и классификация патологий на рентгенограммах грудной клетки, с использованием нейронных сетей
Бакалаврская работа, нейронные сети . Язык работы: Русский. Цена: 4550 р. Год сдачи: 2018 - Нейронная сеть по распознаванию лиц
Бакалаврская работа, информатика. Язык работы: Русский. Цена: 4285 р. Год сдачи: 2023 - ПОСТРОЕНИЕ РАЗЛИЧНЫХ КОНФИГУРАЦИЙ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ
ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ ПТИЦ
Дипломные работы, ВКР, математика. Язык работы: Русский. Цена: 4550 р. Год сдачи: 2025





