Компьютерное зрение - это набор методов и технологий, позволяющий компьютерам не просто обрабатывать изображения как массив данных, а воспринимать их и интерпретировать подобным человеку образом. Все популярнее оно становится в промышленности, так как при помощи подобных методов можно автоматизировать и существенно улучшить процесс, за которым нужен визуальный контроль. Такими процессами могут выступать контроль качества продукта (например, контроль качества железобетонных конструкций, нефтепродуктов, зерна и др.), всевозможные измерения, подсчет количества объектов и многое другое. Особенно важно, что в этой сфере человеческой деятельности уже дано строгое определение задачам, решаемым методами компьютерного зрения, и с течением времени количество этих задач только увеличивается.
В рамках данной работы мы рассматриваем одну из подобных задач, а именно определение дефектов на пиломатериалах, и приводим ей сопутствующее решение при помощи компьютерных технологий. Почти на каждом деревообрабатывающем предприятии осуществляется сортировка с учетом дефектов на полотне доски. Но эта сортировка по качеству все еще часто происходит вручную, когда работник самостоятельно оценивает каждую из досок. Поэтому нельзя сбрасывать со счетов человеческий фактор, потому что на результаты влияет опыт работника, его навыки и многое другое, кроме того, он не может превысить пределы своих возможностей. В итоге, скорость сортировки упирается в быстроту оценки качества человеком, что серьезно задерживает весь процесс. Но скорость и качество процесса можно серьезно повысить, если использовать для решения этой задачи методы компьютерного зрения и машинного обучения. Таким образом, исключается необходимость работникам заниматься монотонной работой и они могут переключить свои силы на решение таких задач производства, какие в силах решить только человек.
Задача, поставленная в рамках данной выпускной квалификационной работы, состояла в создании системы локализации и классификации дефектов на пиломатериалах. Для этого подразумевалось решение сразу нескольких задач: отсечение фона от пласти доски, локализация дефектов и последующая их классификация. В ходе ее решения были получены следующие результаты:
1. Исследованы методы компьютерного зрения, необходимые для локализации пласти доски и отсечения фона.
2. Был осуществлен анализ существующих методов обнаружения особых точек и дескрипторов.
3. Был осуществлен анализ методов пороговой обработки, фильтрации изображения, морфологии и прочих для решения задачи локализации дефектов.
4. Построена модель локализации дефектов по кластеризации ключевых точек, для эффективного применения нуждающаяся в переработке.
5. Построен составной алгоритм локализации дефектов, доказавший свою эффективность на практике.
6. Построен классификатор, основанный на линейном методе опорных векторов. Был признан негодным в результате промежуточных испытаний.
7. Построен классификатор, основанный на свёрточной нейронной сети AlexNet. Данная система классификации показала точность в 98% и была включена в финальную модель.
8. На основе методов локализации и классификатора была разработана и осуществлена финальная модель, система автоматической локализации и классификации дефектов на пласти доски.
9. Было произведено тестирование получившейся системы и показана ее работоспособность.
10. Были предложены возможные улучшения забракованных методов, как и идеи оптимизации осуществленной системы, в частности при помощи FCN.
Исходя из всего вышесказанного, можно утверждать, что поставленная задача была решена полностью. Примененные в модели методы локализации показали целесообразность своего применения, был создан точный классификатор для определения типов дефектов, также реализована пакетная передача данных, что оптимизирует скорость работы. Кроме того, существующую модель при помощи предложенных вариантов улучшения в будущем возможно модифицировать для решения более обширной задачи.
[1] Brendan J. Frey, Delbert Dueck. Clustering by Passing Messages Between Data Points.— 2007.— URL: http://www.icmla-conference.org/icmla07/FreyDueckScience07.pdf.
[2] Dropout: A Simple Way to Prevent Neural Networks from Overfitting / Nitish Srivastava, Geoffrey Hinton, Alex Krizhevsky et al. — 2014. — URL: https://goo.gl/rZMHIF.
[3] Fully Convolutional Architectures for Multi-Class Segmentation in Chest Radiographs / Alexey A. Novikov, David Major, Dimitrios Lenis et al. // CoRR.— 2017.- Vol. abs/1701.08816. - URL: http: //arxiv.org/abs/1701.08816.
[4] Krizhevsky Alex, Sutskever Ilya, Geoffrey E. Hinton. ImageNet Classification with Deep Convolutional Neural Networks.— 2012.— URL: http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf.
[5] Meng Yu. Implementing the Scale Invariant Feature Transform(SIFT) Method. — 2008. — URL: http://citeseerx.ist.psu.edu/viewdoc/ download?doi=10.1.1.102.180&rep=rep1&type=pdf.
[6] Richard O. Duda, Peter E. Hart. Use of Hough Transoformition to detect lines and curves in pictures. — 1971.— URL: http://www.ai. sri.com/pubs/files/tn036-duda71.pdf.
[7] Ronneberger Olaf, Fischer Philipp, Brox Thomas. U-Net: Convolutional Networks for Biomedical Image Segmentation // CoRR.- 2015.- Vol. abs/1505.04597. — URL: http://arxiv.org/abs/1505.04597.
[8] Shelhamer Evan, Long Jonathan, Darrell Trevor. Fully Convolutional Networks for Semantic Segmentation // CoRR. — 2016. — Vol. abs/1605.06211. — URL: http://arxiv.org/abs/1605.06211.
[9] Speeded-Up Robust Features (SURF) / Herbert Bay, Andreas Ess, Tinne Tuytelaars, Luc Van Gool.— 2008.— URL: https://goo.gl/ cKxabb.
[10] Strigl Daniel, Kofler Klaus, Podlipnig Stefan. Performance and Scalability of GPU-based Convolutional Neural Networks. — 2010. — URL: https://goo.gl/eIjHcA.
[11] Zuiderveld Karel. Graphics Gems IV / Ed. by Paul S. Heckbert.— San Diego, CA, USA : Academic Press Professional, Inc., 1994.— P. 474-485. — URL: http://dl.acm.org/citation.cfm?id=180895. 180940.
[12] Воронцов К. В. Математические методы обучения по прецедентам (теория обучения машин).— URL: http://www.machinelearning. ru/wiki/images/6/6d/Voron-ML-1.pdf.
[13] Левитин А. В. Алгоритмы. Введение в разработку и анализ. Глава 3. Метод грубой силы: Поиск выпуклой оболочки. — М. : Вильямс, 2006.-С. 576.
[14] Мерков А.Б. Распознавание образов. Введение в методы статистического обучения. — М. : Едиториал УРСС, 2011. — С. 256.
[15] Шапиро Л., Стокман Д. Компьютерное зрение. — М. : Бином. Лаборатория знаний, 2006. — С. 752.