🔍 Поиск работ

Распознавание сервированных блюд с использованием нейронных сетей

Работа №207002

Тип работы

Дипломные работы, ВКР

Предмет

программирование

Объем работы62
Год сдачи2020
Стоимость4620 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
8
Не подходит работа?

Узнай цену на написание


АННОТАЦИЯ 2
ВВЕДЕНИЕ 8
1 РАСПОЗНАВАНИЕ ОБЪЕКТОВ НА ФОТОГРАФИИ 9
1.1 Классификация изображений 9
1.2 Детекция объектов на изображении 12
1.3 Методы для решения задач классификации и сегментации 13
1.4 Модели 14
1.4.1 Нейронные сети глубокого обучения 14
1.4.2 Сверточные нейронные сети 15
1.5 Балансировка набора данных 18
1.5.1 Удаление миноритарного класса 19
1.5.2 Случайное удаление примеров из мажоритарного класса 19
1.5.3 Дублирование примеров миноритарного класса 19
1.6 Существующие решения и аналоги 19
1.7 Выбор среды разработки 21
1.8 Вывод по главе 1 22
2 АЛГОРИТМ ДЛЯ РЕШЕНИЯ ЗАДАЧИ РАСПОЗНАВАНИЯ 23
2.1 Постановка задачи распознавания 23
2.2 Исходные данные для классификатора 23
2.3 Исходные данные для распознавания 26
2.4 Общий алгоритм для обучения нейронных сетей 28
2.5 Описание классификатора 29
2.6 Описание YOLOv3 31
2.7 Описание EfficentDet 33
2.8 Функции активации и потерь 35
2.9 Функции для оценки точности 36
2.10 Вывод по главе 2 37
3 ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ И ПРОВЕРКА НА ТЕСТОВЫХ
ДАННЫХ 38
3.1 Параметры классификатора 38
3.2 Параметры детектирования с использованием YOLOv3 41
3.3 Параметры детектирования с использованием EfficentDet 43
3.4 Сравнение результатов работы YOLOv3 и EfficentDet 45
3.5 Выводы по 3 главе 47
ЗАКЛЮЧЕНИЕ 48
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 49
ПРИЛОЖЕНИЕ 1 Исходный код 53

Распознавание объектов служит для отнесения исходных данных к одному из заранее определенных классов при помощи выделения некоторых существенных признаков, позволяющих охарактеризовать эти данные.
Проблема распознавания объектов усилено начала приобретать значение в условиях, когда человек не справляется с большим количество информационных перегрузок и не может справиться с линейно-после¬довательным пониманием различных поступающих к нему сообщений.
Таким образом, проблема распознавания объектов начала охватывать самые различные области и оказалась в поле междисциплинар ных исследований, особенно в областях, связанных с нейронными сетями и искусственным интеллектом.
Если раньше задача распознавания в основном применялась для решения задач в области безопасности, то с развитием нейронных сетей количество областей значительно расширилось. Сейчас задачу распознавания можно применить в любой сфере, где имеется видеопоток данных или большое количество изображений.
Целью данной работы является исследование средств машинного и глубоко обучения и их применимость в решении задачи распознавания сервированных блюд .
Для достижения данной цели необходимо решить следующие задачи:
1) исследовать существующие подходы для решения задачи распознавания объектов по фотографии;
2) подготовить набор исходных данных для классификации и детекции;
3) разработать модель нейронной сети для решения поставленной задачи;
4) провести вычислительный эксперимент на подготовленных тестовых данных.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В результате проделанной работы были исследованы существующие методы решения задачи распознавания объектов на фотографии, сделан выбор в пользу нейросетевого подхода, рассмотрены решения и аналоги в области распознавания блюд, рассмотрены среды разработки моделей нейронных сетей.
Были подготовлены данные для решения задач классификации и детекции, определены параметры преобразования для данных, выбраны основные архитектуры для моделей классификации и детекции, рассмотрены различные функции активации и потерь, выбраны метрики точности.
Также были разработаны модели нейронных сетей с использованием выбранных ранее архитектур, подобраны начальные параметры для каждой модели.
Модели протестированы на подготовленных данных. Точность модели классификации составила 87%. Точности моделей детекции составили 88% и 85% соответственно для YOLOv3 и EfficentDet. Произведено сравнение моделей. Модель EfficentDet показала результат сопоставимый с YOLOv3, при этом было затрачено намного меньше времени на обучение, а сама детекция занимает меньше времени. Однако для работы с видеопотоков подходит модель основанная на YOLOv3.
Таким образом все поставленные в работе задачи были выполнены и цель достигнута.



1 Вакуленко, С.А. Практический курс по нейронным сетям: учебное
пособие / С. А. Вакуленко, А. А. Жихарева. - Санкт-Петербург: НИУ ИТМО, 2018. - 71 с. - Текст: электронный // Лань: электронно-библиотечная система. - URL: https://e.lanbook.com/book/136500 (дата обращения:
25.03.2020). - Режим доступа: для авториз. пользователей.
2 Гонсалес, Р. Цифровая обработка изображений: учебник / Р. Гонсалес, Р. Вудс. - Москва: Техносфера, 2005. - 1072 с.
3 Гудфеллоу, Я. Глубокое обучение / Я. Гудфеллоу, И. Бенджио, А. Курвилль; пер. с англ. А.А. Слинкина. - 2-е изд. Москва: ДМК Пресс, 2018. - 652 с. - Текст: электронный // Лань: электронно-библиотечная сис тема. - URL: https://e.lanbook.com/book/107901 (дата обращения: 28.03.2020). - Режим доступа: для авториз. пользователей.
4 Джонс, М.Т. Программирование искусственного интеллекта в приложениях / М.Т. Джонс. - Москва: ДМК Пресс, 2011. - 312 с. - Текст: электронный // Лань: электронно-библиотечная система. - URL: https://e.lanbook.com/book/1244 (дата обращения: 25.04.2020). - Режим доступа: для авториз. пользователей.
5 Дуда, Р. Распознавание образов и анализ сцен / Р. Дуда, П. Харт Москва: Мир, 1976. - 512 с.
6 Калитин, Д.В. Artifical neural networks: учебное пособие /
Д.В. Калитин. - Москва: МИСИС, 2018. - 88 с. - Текст: электронный // Лань: электронно-библиотечная система. - URL: https://e.lanbook.com/book/108048 (дата обращения: 16.03.2020). - Режим доступа: для авториз. пользователей.
7 Классификатор kNN // Хабр [Электронный ресурс] URL: https:// habr.com/ru/post/149693/ (дата обращения: 10.03.2020).
8 Лепешкин, О.М. Анализ методов сегментации изображений / О.М. Лепешкин, С.А. Романов, Ю.П. Стоянов // Молодой учёный. - 2010. - №6(17). - С. 26-28
9 Маккинни, У. Python и анализ данных/ У. Маккинни; перевод с
английского А.А. Слинкина. - 2-е изд., испр. и доп. - Москва: ДМК Пресс, 2020. - 540 с. - Текст: электронный // Лань: электронно-библиотечная
система. - URL: https:ZZe.lanbook.com/ book/131721 (дата обращения: 30.01.2020). - Режим доступа: для авториз. пользователей.
10 Метод ближайших соседей // MachineLearning.ru [Электронный ресурс] URL: https:ZZclck.ru/MCqWe (дата обращения: 15.05.2020).
11 Моделирование и распознавание 2DZ3D образов. Сегментация
изображения. - Дата обновления: 31.07.2018. URL: https:ZZapi-2d3d-
cad.com/segment/ (дата обращения: 06.03.2020)
12 Открытый курс машинного обучения. Тема 3. Классификация,
деревья решений и метод ближайших соседей // Хабр [Электронный ресурс] URL: https:ZZhabr.comZruZcompanyZodsZblogZ322534Z (дата обращения:
10.02.2020).
13 Прэтт У. Цифровая обработка изображений: Пер. с англ. М.: Мир, 1982. Т. 1. 312 с.
14 Рашка, С. Python и машинное обучение: крайне необходимое пособие
по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения: руководство / С. Рашка; перевод с английского А.В. Логунова. - Москва: ДМК Пресс, 2017. - 418 с. - Текст: электронный // Лань: электронно-библиотечная система. - URL:
https://edanbook.com/book/100905 (дата обращения: 05.04.2020). - Режим доступа: для авториз. пользователей.
15 Ростовцев, В.С. Искусственные нейронные сети: учебник /
В.С. Ростовцев. - Санкт-Петербург: Лань, 2019. - 216 с. - Текст:
электронный // Лань: электронно-библиотечная система. - URL: https:ZZe.lanb ook.com/book/122180 (дата обращения: 21.02.2020). - Режим доступа: для авториз. пользователей...33


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ