АННОТАЦИЯ 3
ВВЕДЕНИЕ 3
1 Теоретические основы нейронных сетей для классификации изображений 5
1.1 Обзор технологий машинного обучение 5
1.1.1 Обучение с учителем 7
1.1.2 Обучение без учителя 9
1.1.3 Обучение с подкреплением 10
1.1.4 Глубокое обучение 11
1.2 Классификация с помощью нейронных сетей 13
1.3 Сверточные нейронные сети 14
1.4 Функции активации, потерь и методы оптимизации 16
1.5 Data science 17
2 Методология исследования 19
2.1 Постановка задачи 19
2.2 Датасет 19
2.3 Описание целевых метрик 21
2.4 Обоснование выбора стека технологий 22
3 Эксперименты 25
3.1 Первая архитектура 25
3.2 Вторая архитектура 26
3.3 Третья архитектура 27
3.4 Четвертая архитектура 28
4 Анализ результатов 30
4.1 Анализ метрик 31
4.2 Преимущества и недостатки каждой архитектуры 34
ЗАКЛЮЧЕНИЕ 36
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 38
Приложение А Метрики первой архитектуры 39
Приложение Б Метрики второй архитектуры 40
Приложение В Метрики третьей архитектуры 41
Приложение Г Метрики четвертой архитектуры 42
В настоящее время искусственный интеллект становится все более распространенным и широко известным понятием даже среди детей. Однако, в то же время, существует недостаток знаний о флоре, особенно о растениях, которые произрастают в нашей местности. Это может повлечь негативные последствия для здоровья, поскольку люди могут неосознанно причинять вред себе, не зная о потенциальных опасностях, связанных с определенными растениями.
Машинное обучение и, в частности, нейронные сети, стали ключевыми технологиями, которые проникают во множество сфер нашей жизни. С помощью нейронных сетей можно классифицировать объекты на изображении, предсказывать колебания на различных рынках, синтезировать речь по тексту, менять мимику человека, генерировать текст, подобный написанному человеку и даже играть в игры.
В мире уже повсеместно внедряются нейронные сети, их используют программисты, менеджеры, специалисты по подбору персонала, а также люди в своей повседневной деятельности. Актуальность выбора темы в этой области обусловлена тем, что нейронные сети захватывают все больше работы, которую раньше делали люди, и сейчас происходит новая промышленная революция.
Нейронные сети могут распознавать изображения с высокой точностью, что увеличивает долю применения этой технологии в качестве основной в сфере компьютерного зрения.
Необходимость создания приложения, которое сможет
классифицировать грибы на съедобные и не съедобные вызвано тем, что большинство современных детей не так тесно связаны с природой, как их родители, поэтому могут сильно навредить своему здоровью. Таким образом, обычная поездка в лес на шашлыки для обычного человека может привести к пищевому отравлению.
Объектом исследования данной дипломной работы является классификация изображений с помощью нейронных сетей.
Предметом исследования является бинарная классификация грибов изображений с помощью нейронных сетей .
Целью данного исследования является проверка гипотезы: «Нейронная сеть способна отличить съедобные грибы от ядовитых на основе изображений».
Для достижения данной цели были поставлены следующие задачи:
1. Провести обзор и анализ существующих методов классификации грибов на съедобные и ядовитые.
2. Собрать и подготовить данные: создать набор данных, содержащий изображения различных видов грибов с указанием их съедобности или ядовитости.
3. Провести предварительный анализ данных: визуализировать и проанализировать характеристики изображений, проверить баланс классов, обработать и нормализовать данные при необходимости.
4. Обучить различные архитектуры нейронных сетей. Использовать подготовленный набор данных для обучения с использований различных конфигураций
5. Оценить результаты. Оценить производительность обученных нейронных сетей, используя метрики, такие как точность, полноту.
6. Провести анализ результатов: проанализировать преимущества и ограничения предложенного подхода. Проанализировать возможные улучшения и применения модели.
В ходе данной дипломной работы была проведена проверка гипотезы о возможности нейронной сети отличать съедобные грибы от ядовитых на основе изображений. Целью исследования было оценить производительность нейронной сети на данной задаче и определить ее способность к классификации.
В рамках исследования были протестированы четыре различные архитектуры нейронных сетей. Однако, результаты показали, что ни одна из этих архитектур не смогла классифицировать грибы с достаточно высокой точностью. Метрики, полученные в процессе тестирования, оказались недостаточно высокими для доверительного использования данной нейронной сети в качестве средства распознавания съедобных и ядовитых грибов на основе изображений.
Результаты данного исследования указывают на ограничения выбранных архитектур нейронных сетей в контексте данной задачи классификации грибов. Возможные причины низкой производительности могут быть связаны с недостаточным объемом и разнообразием данных для обучения, а также с особенностями самой задачи распознавания грибов на основе изображений.
Для достижения более высокой точности классификации грибов в будущем, рекомендуется рассмотреть следующие шаги:
Расширение и улучшение набора данных: необходимо обеспечить больший объем разнообразных изображений грибов для обучения и тестирования нейронной сети. Это позволит улучшить общую способность сети к распознаванию и классификации.
Использование более сложных архитектур: следует рассмотреть применение более сложных и глубоких архитектур нейронных сетей, таких как сверточные нейронные сети или предобученные модели, которые могут иметь лучшую способность к классификации изображений.
Улучшение предобработки данных: стоит обратить внимание на процесс предобработки данных, включая улучшение выравнивания и нормализации изображений, а также удаление возможных шумов и искажений, которые могут влиять на производительность сети.
В целом, несмотря на то, что данная дипломная работа не достигла целей в полной мере, она представляет важный шаг в исследовании возможностей нейронных сетей в классификации грибов на основе изображений. Результаты и выводы данного исследования могут быть использованы в качестве отправной точки для дальнейших исследований и разработок в области компьютерного зрения и распознавания образов.
1. Полносвязные сети [Электронный ресурс] URL:
https://studfile.net/preview/1672048/ (дата обращения 18.05.2023)
2. Документация Python [Электронный ресурс] URL:
https://docs.python.org/3/ (дата обращения 19.04.2023)
3. Документация tensorflow [Электронный ресурс] URL:
https://www.tensorflow.org/api_docs/python/tf/all_symbols (дата обращения 03.02.2023)
4. Cats vs Dogs Classification [Электронный ресурс] URL: https://data- flair.training/blogs/cats-dogs-classification-deep-learning-project-beginners/ (дата обращения 20.03.2023)
5. VGG Net [Электронный ресурс] URL:
https://en.everybodywiki.com/VGG_Net (дата обращения 01.06.2023)
6. ImageNet - Wikipedia [Электронный ресурс] URL: https://en.wikipedia.org/wiki/ImageNet (дата обращения 04.06.2023)
7. Accuracy and precision - Wikipedia [Электронный ресурс] URL: https://en.wikipedia.org/wiki/Accuracy_and_precision (дата обращения 24.05.2023)
8. Precision and recall - Wikipedia [Электронный ресурс] URL: https://en.wikipedia.org/wiki/Precision_and_recall (дата обращения 24.05.2023)
9. Замятин А. В. Интеллектуальный анализ данных : учебное пособие:
[для студентов университетов и втузов] / А. В. Замятин ; Нац. исслед. Том. гос. ун-т. - Томск : Издательский Дом Томского государственного университета, 2020. URL:
http://vital.lib.tsu.rU/vital/access/manager/Repository/vtls:000722107