Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА СИСТЕМЫ ВЫЯВЛЕНИЯ ФИТОСАНИТАРНЫХ УГРОЗ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

Работа №74795

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы72
Год сдачи2020
Стоимость4260 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
242
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 9
1. РАЗРАБАТЫВАЕМАЯ СИСТЕМА 14
1.1. Архитектура 14
1.2. Входные данные 16
2. ВЫБОР МЕТОДА КЛАСТЕРИЗАЦИИ 17
2.1. Sliding Window 17
3. ВЫБОР МЕТОДА КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ 19
3.1. Методы 19
3.1.1. Maximum Likelihood 19
3.1.2. Minimum Distance 21
3.1.3. Parallelepiped 23
3.1.4. Mahalanobis Distance 25
3.1.5. K-Nearest Neighboor 26
3.1.6. Decision Tree 27
3.1.7. ANN 27
3.1.8. Image Segmentation 28
3.2. Критерии выбора метода 29
3.3. Выбор метода классификации 31
4. ВЫБОР МЕТОДА СЕГМЕНТАЦИИ И ПРЕДОБРАБОТКИ 32
4.1. U-Net 32
4.2. Обучение Unet 34
5. ОБУЧАЮЩАЯ ВЫБОРКА 39
5.1. Формирование 39
5.2. Аугментация 44
6. ИТОГОВЫЙ СТЕК МЕТОДОВ 46
7. ВЫБОР БИБЛИОТЕКИ ДЛЯ ГЛУБОКОГО ОБУЧЕНИЯ 47
8. МОДУЛЬ КЛАССИФИКАЦИИ 48
8.1. Модуль поиска кандидатов 48
8.2. Тестирование модуля поиска кандидатов 49
8.3. Обучение классификатора 50
8.3.1. Выбор предобученных моделей 50
8.3.2. Утилита для обучения сверточных нейронных сетей 51
8.3.3. Обучение Xception 56
8.3.4. Обучение MobileNetV2 58
8.3.5. Обучение DenseNet121 60
8.3.6. Дообучение DenseNet121 на выборке с аугментацией 62
9. ТЕСТИРОВАНИЕ МОДУЛЯ 64
ЗАКЛЮЧЕНИЕ 67
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 69
ПРИЛОЖЕНИЕ ССЫЛКА НА ПРОЕКТ НА GITHUB 72

Приложения должны быть в работе, но в данный момент отсутствуют


Искусственный интеллект - одна из самых популярных и быстро развивающихся областей науки на сегодняшний день. Алгоритмы искусственного интеллекта используются почти во всех сферах нашей жизни.
Одной из самых популярных задач, решаемых при помощи искусственного интеллекта , является задача классификация. Задача классификации заключается в сопоставлении входных данных одному или нескольким непересекающимся множествам. Входными данными в задаче классификации могут быть изображения, аудиоданные и любые другие данные, которые можно представить в виде цифровой выборки. Задача классификации является весьма актуальной в разных сферах жизни.
Так, например, в медицине - ученые петербургского Политеха вместе с врачами онкоцентра разработали интеллектуальную систему диагностики опухолей в легких, способную распознавать опухоли по компьютерной томографии, а также отличать злокачественные опухоли от доброкачественных^ 1]
Также нейронные сети используются для обеспечения безопасности в сфере дорожного движения. Так, например, в статье [2] ученые из google разработали систему, позволяющую детектировать пешеходов с точностью 78 процентов и работающую в режиме реального времени (детектирование происходит менее чем за 0.07 секунд).
Сельское хозяйство — еще одна сфера, требующая внедрения новых технологий. Агробизнес в России достиг определенной зрелости, о чем свидетельствуют стабилизация уровня инвестиций в сельское хозяйство и рост конкуренции среди производителей сельскохозяйственной продукции. В АПК растет объем и качество применения современных технологий, в том числе систем сбора, хранения и обработки данных. Применяются данные со спутников, датчиков, из операционных и транзакционных систем. При этом увеличивается как объем данных, так и потребность в их качественной обработке и достоверных выводах, на которые можно полагаться, принимая решения. В результате оформляется спрос на промышленные аналитические системы и, в частности, углубленную аналитику. [15]
Современные технологии дали человеческому обществу возможность производить достаточное количество продовольствия для удовлетворения потребностей более чем 7 миллиардов человек. Однако продовольственная безопасность по-прежнему находится под угрозой из-за ряда факторов, включая изменение климата (Tai et al., 2014), снижение численности опылителей (доклад Пленума межправительственной научно-политической платформы по биоразнообразию экосистемы и услуг о работе ее четвертой сессии, 2016), болезни растений (Strange and Scott, 2005) и другие. Болезни растений представляют собой не только угрозу продовольственной безопасности в глобальном масштабе, но и могут иметь катастрофические последствия для мелких фермеров, чьи средства к существованию зависят от здоровых культур. В развивающихся странах более 80% сельскохозяйственной продукции производится мелкими фермерами (UNEP, 2013), и сообщения о потере урожая более чем на 50% из-за вредителей и болезней являются распространенными (Harvey et al., 2014). Кроме того, самая большая часть голодающих людей (50%) живет в мелких фермерских хозяйствах (Sanchez and Swaminathan, 2005), что делает мелких фермеров группой, которая особенно уязвима к нарушениям в поставках продовольствия, вызванным патогенами.
Одной из причин резкого снижения урожайности картофеля является поражение растений вирусными болезнями. Наиболее вредоносные среди них — полосатая, морщинистая и обыкновенная мозаики, скручивание и мозаичное закручивание листьев, аукуба-мозаика и др. Особая опасность вирусных заболеваний картофеля в том, что больные растения не поддаются лечению, а возбудители накапливаются в последующих вегетативных поколениях клубней и являются причиной «вырождения» культуры. Вирусные и вироидные болезни картофеля являются причиной огромных недоборов урожая клубней. Степень снижения урожайности зависит от вида вируса, а также сорта и условий выращивания культуры.
При поражении посадок вирусом 5 недобор урожая может достигать 15¬20%, вирусом X - от 10-15% до 45-50% в зависимости от штамма. Вредоносность вируса Y также варьируется в широких пределах — от 15-20% до почти полного отсутствия урожая, плюс резко снижается товарность клубней больных растений. Вирус М (мозаичное закручивание листьев) обычно более вредоносен, чем вирусы X и S: снижение урожая составляет 15-45%, а содержание крахмала в клубнях уменьшается на 2-3%. Снижение продуктивности растений от вируса L (скручивание листьев) может достигать 50-70%, а от вироида веретеновидности — 85%.
При комплексных вирусных инфекциях недоборы урожая еще ощутимее. Например, при одновременном поражении растений вирусами X и М урожайность снижается на 55-60%, а вирусами X, М и Y — на 80% и более, т. е. инфицированые растения урожая практически не дают. [13]
Таким образом, можно сделать вывод, что существует необходимость своевременного обнаружения на полях больных растений для принятия мер по их изоляции от остальных растений. Для быстрого поиска больных растений по видимым признакам можно использовать фотографии поля, сделанные с беспилотника. В роли детектора может выступать специалист-агроном, однако у такого подхода есть несколько очевидных минусов:
• при выполнении алгоритмической работы человек теряет концентрацию и качество выполнения работы заметно падает
• человек уступает компьютеру в скорости детектирования, особенно на больших данных
Система автоматического детектирования больных растений здесь подошла бы куда лучше.
Целью данной бакалаврской работы является разработка программного модуля выявления зараженных растений с использованием методов машинного обучения с учителем.
Для достижения поставленной цели необходимо решить следующие задачи:
• разработать графическую утилиту, позволяющую отмечать на изображениях больные участки и сохранять результаты разметки для дальнейшего формирования обучающих выборок
• разработать графическую утилиту, позволяющую производить аугментацию исходной выборки изображений
• разработать утилиту, позволяющую производить обучение и тестирование классификатора
• разработать графическую утилиту, позволяющую тестировать разработанный модуль
На первый взгляд может показаться, что бакалаврская работа повторяет магистерскую работу [18], однако стоит заметить, что ключевым отличием целевой системы является ее способность производить поиск больных растений на полях по фотографиям сделанным с беспилотника в уличных условиях. То есть ориентирована целевая система в первую очередь на автоматизированную обработку больших объемов данных при минимальном участии человека.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


При выполнении работы:
• обоснована актуальность разработки системы выявления фитосанитарных угроз с использованием методов машинного обучения с учителем
• обоснована актуальность использования методов искуственного интеллекта для задачи классификации изображений
• проанализированы методы кластеризации, сегментации и классификации изображений
• разработаны графические утилиты для:
◦ разметки фотографий и формирования обучающих выборок
◦ аугментации сформированных выборок
◦ обучения и тестирования сверточных нейронных сетей
◦ тестирования модуля на фотографиях
При помощи разработанного программного обеспечения от специалистов по защите растений была получена выборка состоящая из 407 примеров фитофтороза, 344 примеров здорового куста, 501 примера мозаики картофеля и 288 примеров сорняков. Полученная выборка была расширена и увеличена в 4 раза при помощи добавления изображений с пониженным и повышенным контрастом с целью обучения классификатора распознавать фотографии в разное время суток и при разном освещении, поскольку входными данными классификатора являются фотографии сделанные в уличных условиях.
На исходных данных были дообучены 3 предобученных модели: Xception, MobileNetV2 и DenseNet121. DenseNet121 показала наилучший результат и была дообучена на данных с аугментацией. Точность классификатора на экзаменационных данных составила 98-99 процентов.
Также для того, чтобы снизить ненужную нагрузку на нейронную сеть, в модуль классификации был добавлен модуль поиска растений в массиве фотографий. Для тестирования модуля была дополнительно сформирована выборка состоящая из 120 фотографий растений и 80 фотографий земли.
Для модуля классификации и модуля поиска растений были написаны регресионные тесты, проверяющие точность работы модулей на специально сформированных при помощи разработанного ПО выборках. К модулю поиска растений и модулю классификации растений были предъявлены требования по точности определения в 100 и 95 процентов соответственно. Тесты обоими модулями были успешно пройдены.
По итогам работы можно сделать вывод о том, что классификация болезней растений по фотографиям сделанным с небольшой высоты решается методом сверточных нейронных сетей довольно точно. Таким образом, существует возможность своевременно обнаруживать на полях больные растения используя беспилотный летательный аппарат для съемки полей.
В дальнейшем планируется расширять исходную выборку и дообучать классификатор на новых данных, поскольку исходная выборка в основном лишь подтвердила гипотезу о возможности разработки заявленной системы, а для получения универсальной системы детектирования необходимо собрать больше данных и провести больше полевых экспериментов.



1. Alexey Lukashin, Alexander Ilyashenko, Lev Utkin, Vladimir Muliukha . Alzimov: the Platform for Intellectual Diagnostics of Lung Cancer [электронный
ресурс] :https://fruct.org/publications/acm 25/files/L uk.pdf
2. Anelia Angelova, Alex Krizhevsky, Vincent Vanhoucke, Abhijit Ogale, Dave Ferguson. Real-Time Pedestrian Detection With Deep Network Cascades [электронный ресурс] :https://research.google/pubs/pub43850/
3. Arthur Ouaknine. Review of Deep Learning Algorithms for Image Semantic Segmentation [электронный
ресурс]:https://medium.com/@arthur ouaknine/review-of-deep-learning-algorithms-for-image-semantic-segmentation-509a600f7b57
4. Dimitrios Marmanis . Mihai Datcu [электронный ресурс] :https://ieeexplore.ieee.org/abstract/document/7342907
5. JiaboSun, JianyuYang, ChaoZhang, WenjuYun, JieqingQu. Automatic remotely sensed image classification in a grid environment based on the maximum likelihood method [электронный
ресурс]:https://www.sciencedirect.com/science/article/pii/S0895717711006686
6. Image Classification [электронный ресурс] :https://cs231n.github.io/classification/
7. Понимание сверточных нейронных сетей с помощью визуализаций в PyTorch [электронный ресурс] :https://ru.sciencewal.com/65986-understanding-
convolutional-neural-networks-through-visualizations-in-pytorch-b5444de08b91-97#menu-3
8. ИТ в агропромышленном комплексе России [электронный ресурс]:http://www.tadviser.ru/index.php/Статья:ИТ в агропромышленном комплексе России
10. Вирусные болезни картофеля и меры по ограничению их распространения [электронный ресурс] :http://www.agrocounsel.ru/virusnye-bolezni-kartofelya-i-mery-po-ogranicheniyu-ih-rasprostraneniya
12. SUPERVISED IMAGE CLASSIFICATION USING MINIMUM DISTANCE ALGORITHM [электронный ресурс]:http://www.50northspatial.org/supervised-image-classification-using-minimum-distance-algorithm/
13. Простейшая кластеризация изображени методом к-средних (k-means) [электронный ресурс] :https://habr.com/ru/post/165087/
14. Keras vs TensorFlow vs PyTorch : Comparison of the Deep Learning Frameworks [электронный ресурс] :https://www.edureka.co/blog/keras-vs-tensorflow-vs-pytorch/
15. Randall B. Smith, Ph.D. Image Classficication [электронный ресурс]:https://www.microimages.com/documentation/Tutorials/classify.pdf
16. Selva Prabhakaran. Mahalonobis Distance - Understanding the math with examples [электронный
ресурс]:https://www.machinelearningplus.com/statistics/mahalanobis-distance/
17. Sharada P. Mohanty, David P. Hughes, Marcel Salathe. Using Deep Learning for Image-Based Plant Disease Detection [электронный
ресурс]:https://www.frontiersin.org/articles/9.3389/fpls.2016.01419/full
18. Sunitha Abburu, Suresh Babu Golla . Satellite Image Classification Methods and Techniques: A Review [электронный
ресурс] :http://citeseerx.ist.psu.edu/viewdoc/download?
doi=9.1.1.695.1415&rep=rep1&type=pdf
19. Н.Ю. Мартюшева. Разработка информационной системы для автоматизированной диагностики заболеваний растений: выпускная квалификационная работа магистра: 09.04.01 - Информатика и вычислительная техника ; 09.04.01_15 - Технологии проектирования системного и прикладного программного обеспечения [электронный ресурс]:https://elib.spbstu.ru/dl/3/2019/vr/vr19-719.pdf/info


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ