🔍 Поиск работ

РАЗРАБОТКА МОДЕЛИ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ТОВАРОВ С ИСПОЛЬЗОВАНИЕМ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ

Работа №206514

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы85
Год сдачи2020
Стоимость4850 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
16
Не подходит работа?

Узнай цену на написание


АННОТАЦИЯ 2
ВВЕДЕНИЕ 8
ГЛАВА 1. ТЕОРЕТЧИЕСКИЕ ОСНОВЫ ФУНКЦИОНИРОВАНИЯ ПРОЦЕССА
РАСПОЗНАНИЯ ИЗОБРАЖЕНИЙ 11
1.1 Процесс распознания изображений 11
1.2 Нейронные сети 18
1.3 Deep learning 23
1.4 Анализ существующих библиотек 31
Вывод по разделу один 34
ГЛАВА 2. МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ, ИСПОЛЬЗУЕМЫЕ ДЛЯ
РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ 36
2.1 Деревья решений 36
2.2 Ансамбли моделей машинного обучения 37
2.2.1 Бегинг или Бутстреп-агрегирование 38
2.2.2 Бустинг 41
2.2.2.1 Алгоритм AdaBoost 44
2.2.2.2 Алгоритм Gradient boosting 48
2.2.3 Стекинг 51
2.3 Нейронные сети 53
2.4 Сверточная нейронная сеть 54
Выводы по разделу два 56
ГЛАВА 3. РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ ТОВАРОВ 57
3.1 Примеры изображений товаров 57
3.2 Подготовка данных 59
3.3 Выбор метрики 63
3.4 Построение моделей 66
3.5 Анализ результатов 77
Вывод по разделу три 78
ГЛАВА 4. КОММЕРЦАЛИЗАЦИЯ ПРОЕКТА 79
4.1 Пути коммерциализации проекта 80
4.2 Участники процесса 83
4.3 Стратегия коммерциализации проекта 83
Выводы по разделу четыре 84
ЗАКЛЮЧЕНИЕ 85
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 87


Темой данного исследования является разработка системы распознавания изображений на основе аппарата искусственных нейронных сетей. Задача распознавания изображений является очень важной, так как возможность автоматического распознавания компьютером изображений приносит множество новых возможностей в развитии науки и техники, таких, как разработка систем поиска лиц и других объектов на фотографиях, контроля качества производимой продукции без участия человека, автоматического управления транспортом и множество других.
Что касается искусственных нейронных сетей, то в последние годы данный раздел машинного обучения получается все большее развитие в связи со значительным повышением вычислительных мощностей существующих компьютеров и повсеместном распространении применения графических карт для вычислений, что позволяет обучать нейронные сети гораздо большей глубины и сложной структуры чем раньше, которые, в свою очередь, показывают значительно лучшие результаты по сравнению с другими алгоритмами для многих задач, в особенности задачи распознавания изображений. Данное направление развития нейронных сетей получило название deep learning (“глубокое обучение”) и является одним из наиболее успешных и быстро развивающихся в настоящее время. Так, например, по результатам ежегодного соревнования по распознаванию изображений ImageNet-2014 подавляющее большинство успешных алгоритмов использовало глубокие сверточные сети.
Актуальность выбранной темы заключается в том, что на сегодняшний день функция поиска по картинке имеет все больший и больший спрос у посетителей интернет-магазина. Не верно сформулировав текстовый поисковой запрос, посетитель может уйти из интернет-магазина, так и не найдя необходимый ему товар. Наличие поиска по изображению увеличивает вероятность нахождения нужного клиенту товара, что ведёт к росту покупок с сайта, а, следовательно, и росту прибыли компании.
Так как задача распознавания изображений является очень обширной и в большинстве случаев требует отдельного подхода для различных типов изображений, то рассмотреть задачу распознавания изображений в целом в рамках одного исследования практически невозможно, поэтому было принято решение для примера рассмотреть отдельно такую подзадачу распознавания изображений, как распознавание товаров на изображении.
Таким образом, основной целью данного исследования была разработка системы распознавания изображений на основе искусственных нейронных сетей для изображений товаров. Для достижения данной цели были сформулированы следующие задачи:
- выполнение аналитического обзора литературы по теме искусственных нейронных сетей и их применения для задачи распознавания изображений;
- сравнение различных способов обучение сверточных нейронных сетей;
- разработка алгоритма для распознавания товаров на изображении с применением аппарата искусственных нейронных сетей;
- разработка прототипа системы распознавания изображений на основе разработанного алгоритма. Результатом выполнения данной задачи должен являться программный комплекс, позволяющий пользователю загрузить изображение и получить предсказание класса данного изображения;
- проведение экспериментальных исследований. Необходимо провести исследования и оценить точность работы полученного алгоритма.
В ходе проведенного исследования все поставленные задачи были выполнены. Конкретные результаты по каждой из них будут описаны в основной части работы.
Объектом исследовательской работы является процесс поиска товара по изображению.
Предметом исследования является процесс распознания и классификация товаров на изображении.
Новизна работы заключается в том, что на основе комплексного анализа:
- рассмотрены и проанализированы методы распознания и классификации изображений;
- проведен сравнительный анализ методов;
- разработана модель распознания товаров на изображении;
- проведен сравнительный анализ результатов исследования, сделаны выводы и даны рекомендации;
- разработан план коммерциализации модели распознания
изображений.
Практическая значимость работы обусловлена применением результатов исследования на практике, для повышения продаж интернет-магазина за счёт более легкого поиска необходимого товара.
Апробация работы:
1) Алексеева Н.А. Использование методов Data science в экономических науках/ Н.А. Алексеева // XXIV Международная научно-практическая конференция “Eurasiascience” (2018).

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе написания магистерской диссертации решены задачи:
1) проведен анализ предметной области и обзор существующих решений;
2) проведено сравнение разных методов машинного обучения и выбран метод сверточных нейронных сетей для построения модели распознания товаров на изображении;
3) изучение метрик точности работы методов обучения, выбор метрики для разрабатываемой системы и анализ результатов проверки точности модели;
4) разработка системы на основе выбранной модели и проведение экспериментальной части;
5) построение стратегии коммерциализации проекта.
Были построены три модели различных сверточных нейронных сетей:
CNN4, состоящей из четырех сверточных слоев и завершается двумя полносвязными слоями, последний из которых применяет к значениям предыдущих слоев активационную функцию softmax. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,689.
CNN6, состоящей из шести сверточных слоев и завершается двумя полносвязными слоями, последний из которых применяет к значениям предыдущих слоев активационную функцию softmax. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,723.
ICNN2, для решения новой задачи были отсечены последние обученные полносвязные слои сети, которые были заменены двумя полносвязными необученными слоями. Модель оптимизирована стохастическим градиентным спуском. Показатель точности модели - 0,73.
Проведенные эксперименты показали, что набор моделей ICNN2 дает наилучшую точность классификации, поэтому его применение более эффективно. Дальнейшим направлением развития будет улучшение качества классификации для достижения значения average accuracy 0,8 и введение механизма в эксплуатацию.
В заключение работы был рассмотрен проект коммерциализации. В нем были рассмотрены методы коммерциализации, на основе сравнения этих методов был выбран метод полной передачи прав на инновацию. Так же были построена стратегия коммерциализации проекта, включающая в себя этапы необходимые для вывода проекта на рынок.
Таким образом, была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.



1. McCulloch W. S., Pitts W. A logical calculus of the ideas immanent in nervous activity //The bulletin of mathematical biophysics. - 1943. - Т. 5. - №. 4. - С. 115-133.
2. Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain //Psychological review. - 1958. - Т. 65. - №. 6. - С. 386.
3. Minsky M., Seymour P. Perceptrons. - 1969.
4. Bengio Y., Goodfellow I., Courville A . Deep Learning. - MIT Press, book in preparation.
5. Cire§an D. C. et al. Deep big multilayer perceptrons for digit recognition //Neural Networks: Tricks of the Trade. - Springer Berlin Heidelberg, 2012. - С. 581-598.
6. Baldi P. Autoencoders, Unsupervised Learning, and Deep Architectures //ICML Unsupervised and Transfer Learning. - 2012. - Т. 27. - С. 37-50.
7. LeCun Y., Bengio Y. Convolutional networks for images, speech, and time series //The handbook of brain theory and neural networks. - 1995. - Т. 3361. - С. 310.
8. Huttenlocher D. P., Ullman S. Object recognition using alignment //Proc. ICCV. - 1987. - Т. 87. - С. 102-111.
9. Canny J. A computational approach to edge detection //Pattern Analysis and Machine Intelligence, IEEE Transactions on. - 1986. - №. 6. - С. 679-698.
10.Serra J. Introduction to mathematical morphology //Computer vision, graphics, and image processing. - 1986. - Т. 35. - №. 3. - С. 283-305.
11. Daugman J. G. Complete discrete 2-D Gabor transforms by neural networks for image analysis and compression //Acoustics, Speech and Signal Processing, IEEE Transactions on. - 1988. - Т. 36. - №. 7. - С. 1169-1179.
12. Harris C., Stephens M. A combined corner and edge detector //Alvey vision conference. - 1988. - Т. 15. - С. 50.
13. Bergstra J. et al. Theano: A CPU and GPU math compiler in Python //Proc. 9th Python in Science Conf. - 2010. - С. 1-7.
14. Goodfellow I. J. et al. Pylearn2: a machine learning research library //arXiv preprint arXiv:1308.4214. - 2013.
15. Michael Kearns(1988); Thoughts on Hypothesis Boosting, Unpublished
manuscript (Machine Learning class project, December 1988).
..31


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ