РАЗРАБОТКА МОДЕЛИ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ТОВАРОВ С ИСПОЛЬЗОВАНИЕМ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ
|
АННОТАЦИЯ 2
ВВЕДЕНИЕ 8
ГЛАВА 1. ТЕОРЕТЧИЕСКИЕ ОСНОВЫ ФУНКЦИОНИРОВАНИЯ ПРОЦЕССА
РАСПОЗНАНИЯ ИЗОБРАЖЕНИЙ 11
1.1 Процесс распознания изображений 11
1.2 Нейронные сети 18
1.3 Deep learning 23
1.4 Анализ существующих библиотек 31
Вывод по разделу один 34
ГЛАВА 2. МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ, ИСПОЛЬЗУЕМЫЕ ДЛЯ
РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ 36
2.1 Деревья решений 36
2.2 Ансамбли моделей машинного обучения 37
2.2.1 Бегинг или Бутстреп-агрегирование 38
2.2.2 Бустинг 41
2.2.2.1 Алгоритм AdaBoost 44
2.2.2.2 Алгоритм Gradient boosting 48
2.2.3 Стекинг 51
2.3 Нейронные сети 53
2.4 Сверточная нейронная сеть 54
Выводы по разделу два 56
ГЛАВА 3. РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ ТОВАРОВ 57
3.1 Примеры изображений товаров 57
3.2 Подготовка данных 59
3.3 Выбор метрики 63
3.4 Построение моделей 66
3.5 Анализ результатов 77
Вывод по разделу три 78
ГЛАВА 4. КОММЕРЦАЛИЗАЦИЯ ПРОЕКТА 79
4.1 Пути коммерциализации проекта 80
4.2 Участники процесса 83
4.3 Стратегия коммерциализации проекта 83
Выводы по разделу четыре 84
ЗАКЛЮЧЕНИЕ 85
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 87
ВВЕДЕНИЕ 8
ГЛАВА 1. ТЕОРЕТЧИЕСКИЕ ОСНОВЫ ФУНКЦИОНИРОВАНИЯ ПРОЦЕССА
РАСПОЗНАНИЯ ИЗОБРАЖЕНИЙ 11
1.1 Процесс распознания изображений 11
1.2 Нейронные сети 18
1.3 Deep learning 23
1.4 Анализ существующих библиотек 31
Вывод по разделу один 34
ГЛАВА 2. МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ, ИСПОЛЬЗУЕМЫЕ ДЛЯ
РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ 36
2.1 Деревья решений 36
2.2 Ансамбли моделей машинного обучения 37
2.2.1 Бегинг или Бутстреп-агрегирование 38
2.2.2 Бустинг 41
2.2.2.1 Алгоритм AdaBoost 44
2.2.2.2 Алгоритм Gradient boosting 48
2.2.3 Стекинг 51
2.3 Нейронные сети 53
2.4 Сверточная нейронная сеть 54
Выводы по разделу два 56
ГЛАВА 3. РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ ТОВАРОВ 57
3.1 Примеры изображений товаров 57
3.2 Подготовка данных 59
3.3 Выбор метрики 63
3.4 Построение моделей 66
3.5 Анализ результатов 77
Вывод по разделу три 78
ГЛАВА 4. КОММЕРЦАЛИЗАЦИЯ ПРОЕКТА 79
4.1 Пути коммерциализации проекта 80
4.2 Участники процесса 83
4.3 Стратегия коммерциализации проекта 83
Выводы по разделу четыре 84
ЗАКЛЮЧЕНИЕ 85
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 87
Темой данного исследования является разработка системы распознавания изображений на основе аппарата искусственных нейронных сетей. Задача распознавания изображений является очень важной, так как возможность автоматического распознавания компьютером изображений приносит множество новых возможностей в развитии науки и техники, таких, как разработка систем поиска лиц и других объектов на фотографиях, контроля качества производимой продукции без участия человека, автоматического управления транспортом и множество других.
Что касается искусственных нейронных сетей, то в последние годы данный раздел машинного обучения получается все большее развитие в связи со значительным повышением вычислительных мощностей существующих компьютеров и повсеместном распространении применения графических карт для вычислений, что позволяет обучать нейронные сети гораздо большей глубины и сложной структуры чем раньше, которые, в свою очередь, показывают значительно лучшие результаты по сравнению с другими алгоритмами для многих задач, в особенности задачи распознавания изображений. Данное направление развития нейронных сетей получило название deep learning (“глубокое обучение”) и является одним из наиболее успешных и быстро развивающихся в настоящее время. Так, например, по результатам ежегодного соревнования по распознаванию изображений ImageNet-2014 подавляющее большинство успешных алгоритмов использовало глубокие сверточные сети.
Актуальность выбранной темы заключается в том, что на сегодняшний день функция поиска по картинке имеет все больший и больший спрос у посетителей интернет-магазина. Не верно сформулировав текстовый поисковой запрос, посетитель может уйти из интернет-магазина, так и не найдя необходимый ему товар. Наличие поиска по изображению увеличивает вероятность нахождения нужного клиенту товара, что ведёт к росту покупок с сайта, а, следовательно, и росту прибыли компании.
Так как задача распознавания изображений является очень обширной и в большинстве случаев требует отдельного подхода для различных типов изображений, то рассмотреть задачу распознавания изображений в целом в рамках одного исследования практически невозможно, поэтому было принято решение для примера рассмотреть отдельно такую подзадачу распознавания изображений, как распознавание товаров на изображении.
Таким образом, основной целью данного исследования была разработка системы распознавания изображений на основе искусственных нейронных сетей для изображений товаров. Для достижения данной цели были сформулированы следующие задачи:
- выполнение аналитического обзора литературы по теме искусственных нейронных сетей и их применения для задачи распознавания изображений;
- сравнение различных способов обучение сверточных нейронных сетей;
- разработка алгоритма для распознавания товаров на изображении с применением аппарата искусственных нейронных сетей;
- разработка прототипа системы распознавания изображений на основе разработанного алгоритма. Результатом выполнения данной задачи должен являться программный комплекс, позволяющий пользователю загрузить изображение и получить предсказание класса данного изображения;
- проведение экспериментальных исследований. Необходимо провести исследования и оценить точность работы полученного алгоритма.
В ходе проведенного исследования все поставленные задачи были выполнены. Конкретные результаты по каждой из них будут описаны в основной части работы.
Объектом исследовательской работы является процесс поиска товара по изображению.
Предметом исследования является процесс распознания и классификация товаров на изображении.
Новизна работы заключается в том, что на основе комплексного анализа:
- рассмотрены и проанализированы методы распознания и классификации изображений;
- проведен сравнительный анализ методов;
- разработана модель распознания товаров на изображении;
- проведен сравнительный анализ результатов исследования, сделаны выводы и даны рекомендации;
- разработан план коммерциализации модели распознания
изображений.
Практическая значимость работы обусловлена применением результатов исследования на практике, для повышения продаж интернет-магазина за счёт более легкого поиска необходимого товара.
Апробация работы:
1) Алексеева Н.А. Использование методов Data science в экономических науках/ Н.А. Алексеева // XXIV Международная научно-практическая конференция “Eurasiascience” (2018).
Что касается искусственных нейронных сетей, то в последние годы данный раздел машинного обучения получается все большее развитие в связи со значительным повышением вычислительных мощностей существующих компьютеров и повсеместном распространении применения графических карт для вычислений, что позволяет обучать нейронные сети гораздо большей глубины и сложной структуры чем раньше, которые, в свою очередь, показывают значительно лучшие результаты по сравнению с другими алгоритмами для многих задач, в особенности задачи распознавания изображений. Данное направление развития нейронных сетей получило название deep learning (“глубокое обучение”) и является одним из наиболее успешных и быстро развивающихся в настоящее время. Так, например, по результатам ежегодного соревнования по распознаванию изображений ImageNet-2014 подавляющее большинство успешных алгоритмов использовало глубокие сверточные сети.
Актуальность выбранной темы заключается в том, что на сегодняшний день функция поиска по картинке имеет все больший и больший спрос у посетителей интернет-магазина. Не верно сформулировав текстовый поисковой запрос, посетитель может уйти из интернет-магазина, так и не найдя необходимый ему товар. Наличие поиска по изображению увеличивает вероятность нахождения нужного клиенту товара, что ведёт к росту покупок с сайта, а, следовательно, и росту прибыли компании.
Так как задача распознавания изображений является очень обширной и в большинстве случаев требует отдельного подхода для различных типов изображений, то рассмотреть задачу распознавания изображений в целом в рамках одного исследования практически невозможно, поэтому было принято решение для примера рассмотреть отдельно такую подзадачу распознавания изображений, как распознавание товаров на изображении.
Таким образом, основной целью данного исследования была разработка системы распознавания изображений на основе искусственных нейронных сетей для изображений товаров. Для достижения данной цели были сформулированы следующие задачи:
- выполнение аналитического обзора литературы по теме искусственных нейронных сетей и их применения для задачи распознавания изображений;
- сравнение различных способов обучение сверточных нейронных сетей;
- разработка алгоритма для распознавания товаров на изображении с применением аппарата искусственных нейронных сетей;
- разработка прототипа системы распознавания изображений на основе разработанного алгоритма. Результатом выполнения данной задачи должен являться программный комплекс, позволяющий пользователю загрузить изображение и получить предсказание класса данного изображения;
- проведение экспериментальных исследований. Необходимо провести исследования и оценить точность работы полученного алгоритма.
В ходе проведенного исследования все поставленные задачи были выполнены. Конкретные результаты по каждой из них будут описаны в основной части работы.
Объектом исследовательской работы является процесс поиска товара по изображению.
Предметом исследования является процесс распознания и классификация товаров на изображении.
Новизна работы заключается в том, что на основе комплексного анализа:
- рассмотрены и проанализированы методы распознания и классификации изображений;
- проведен сравнительный анализ методов;
- разработана модель распознания товаров на изображении;
- проведен сравнительный анализ результатов исследования, сделаны выводы и даны рекомендации;
- разработан план коммерциализации модели распознания
изображений.
Практическая значимость работы обусловлена применением результатов исследования на практике, для повышения продаж интернет-магазина за счёт более легкого поиска необходимого товара.
Апробация работы:
1) Алексеева Н.А. Использование методов Data science в экономических науках/ Н.А. Алексеева // XXIV Международная научно-практическая конференция “Eurasiascience” (2018).
В ходе написания магистерской диссертации решены задачи:
1) проведен анализ предметной области и обзор существующих решений;
2) проведено сравнение разных методов машинного обучения и выбран метод сверточных нейронных сетей для построения модели распознания товаров на изображении;
3) изучение метрик точности работы методов обучения, выбор метрики для разрабатываемой системы и анализ результатов проверки точности модели;
4) разработка системы на основе выбранной модели и проведение экспериментальной части;
5) построение стратегии коммерциализации проекта.
Были построены три модели различных сверточных нейронных сетей:
CNN4, состоящей из четырех сверточных слоев и завершается двумя полносвязными слоями, последний из которых применяет к значениям предыдущих слоев активационную функцию softmax. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,689.
CNN6, состоящей из шести сверточных слоев и завершается двумя полносвязными слоями, последний из которых применяет к значениям предыдущих слоев активационную функцию softmax. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,723.
ICNN2, для решения новой задачи были отсечены последние обученные полносвязные слои сети, которые были заменены двумя полносвязными необученными слоями. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,73.
Проведенные эксперименты показали, что набор моделей ICNN2 дает наилучшую точность классификации, поэтому его применение более эффективно. Дальнейшим направлением развития будет улучшение качества классификации для достижения значения average accuracy 0,8 и введение механизма в эксплуатацию.
В заключение работы был рассмотрен проект коммерциализации. В нем были рассмотрены методы коммерциализации, на основе сравнения этих методов был выбран метод полной передачи прав на инновацию. Так же были построена стратегия коммерциализации проекта, включающая в себя этапы необходимые для вывода проекта на рынок.
Таким образом, была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.
1) проведен анализ предметной области и обзор существующих решений;
2) проведено сравнение разных методов машинного обучения и выбран метод сверточных нейронных сетей для построения модели распознания товаров на изображении;
3) изучение метрик точности работы методов обучения, выбор метрики для разрабатываемой системы и анализ результатов проверки точности модели;
4) разработка системы на основе выбранной модели и проведение экспериментальной части;
5) построение стратегии коммерциализации проекта.
Были построены три модели различных сверточных нейронных сетей:
CNN4, состоящей из четырех сверточных слоев и завершается двумя полносвязными слоями, последний из которых применяет к значениям предыдущих слоев активационную функцию softmax. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,689.
CNN6, состоящей из шести сверточных слоев и завершается двумя полносвязными слоями, последний из которых применяет к значениям предыдущих слоев активационную функцию softmax. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,723.
ICNN2, для решения новой задачи были отсечены последние обученные полносвязные слои сети, которые были заменены двумя полносвязными необученными слоями. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,73.
Проведенные эксперименты показали, что набор моделей ICNN2 дает наилучшую точность классификации, поэтому его применение более эффективно. Дальнейшим направлением развития будет улучшение качества классификации для достижения значения average accuracy 0,8 и введение механизма в эксплуатацию.
В заключение работы был рассмотрен проект коммерциализации. В нем были рассмотрены методы коммерциализации, на основе сравнения этих методов был выбран метод полной передачи прав на инновацию. Так же были построена стратегия коммерциализации проекта, включающая в себя этапы необходимые для вывода проекта на рынок.
Таким образом, была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.





