Классификация с учителем играет центральную роль в анализе данных дистанционного зондирования, например, для составления карт землепользования или земного покрова, инвентаризации лесов или мониторинга городских территорий [4]. Классификаторы, основанные на методе опорных векторов (SVM, Support Vector Machine), в последнее время привлекают значительное внимание как из-за их способности к обобщению даже с входными данными большой размерности, так и из-за их точных результатов во многих приложениях [5, 6]. Однако теория SVM была разработана с акцентом на независимые и одинаково распределенные выборки и метки классов. С точки зрения классификации изображений этот фокус приводит к изначально неконтекстному подходу, то есть каждый пиксель классифицируется как таковой, независимо от соседних пикселей [4]. Этот подход не учитывает информацию, связанную с корреляциями между отдельными пикселями изображения, и представляет собой сильное ограничение на использование классификаторов на основе SVM для анализа изображений.
В этой работе я воспользовался интегрированной структурой, предложенной в статье "Combining Support Vector Machines and Markov Random Fields in an Integrated Framework for Contextual Image Classification" [1], которая объединяет подходы SVM и марковского случайного поля (MRF, Markov Random Field) [7] к классификации и, следовательно, позволяет ввести строгое контекстуальное обобщение SVM. MRF — это очень общее семейство вероятностных моделей, которые позволяют включать пространственную информацию в байесовские схемы анализа изображений с точки зрения минимизации подходящих "энергетических функций" [7, 8]. Соответственно, комбинирование байесовских схем обработки с моделями MRF довольно просто, но SVM — это небайесовские методы классификации, что делает проблему интеграции подходов SVM и MRF нетривиальной.
Эта проблема может быть выражена в общих рамках обработки изображений и распознавания образов, но играет особенно важную роль в дистанционном зондировании, особенно в отношении проблемы размерности и специфических характеристик пространственного контекста в изображениях Земли. Классификация таких изображений часто требует работы с данными большой размерности. Типичными примерами являются задачи классификации, которые включают гиперспектральные изображения и/или извлечение нескольких дополнительных признаков (например, текстового описания). И, напротив, работа с многомерными данными обычно не требуется в других областях обработки изображений (например, биомедицинская визуализация или компьютерное зрение). Проблема размерности данных критически влияет на точность контролируемых классификаторов из-за "проклятия размерности". Это явление вызывает серьезную потерю точности, когда количество обучающих выборок недостаточно для вычисления надежных оценок параметров классификатора в многомерном пространстве признаков. Чтобы избежать таких проблем, при дистанционном зондировании часто применяется сокращение признаков перед классификацией. Однако этот предварительный шаг нетривиален и, возможно, требует много времени. Методы опорных векторов не требуют предварительного сокращения признаков, поскольку они доказали свою устойчивость к "проклятию размерности" (если размер обучающей выборки не очень мал). Поэтому в настоящее время они признаны мощными инструментами в решении проблем размерности и вызвали большой интерес к классификации изображений дистанционного зондирования.
Точно так же контекстную информацию на изображениях дистанционного зондирования трудно смоделировать с точки зрения формы объекта (в отличие от других приложений распознавания изображений) из-за наличия естественного покрова и большого разнообразия форм и размеров искусственного покрова на Земле [9]. Напротив, модели MRF, которые характеризуют локальную и глобальную пространственную статистику изображений на попиксельной основе, обычно достаточно гибки, чтобы захватывать контекстную информацию, связанную с изображениями дистанционного зондирования. Эти свойства объясняют успех моделей MRF во многих задачах классификации, в том числе связанных с мультисенсорными [10], мультитемпоральными [11, 12, 13] или крупномастштабными спутниковыми изображениями [14].
Вышеупомянутые соображения мотивируют полезность интеграции SVM и MRF в уникальную структуру для совместного использования как спектральной, так и пространственной информации, связанной с подлежащим классификации изображением дистанционного зондирования. Предложенная структура [1] разработана путем определения аналитической взаимосвязи между марковским правилом принятия решений с минимальной энергией и применением SVM в соответствующем преобразованном пространстве, индуцированном определенным ядром (которое будет называться "марковским ядром"). Предыдущие методы были разработаны для включения пространственной информации в функции ядра для классификации изображений дистанционного зондирования (см., например, [16] или [17]). Однако, в отличие от этих методов, предлагаемая стратегия направлена на полную интеграцию подходов SVM и MRF в уникальную структуру. Эта формулировка представляет собой строгий и гибкий инструмент для включения контекстной информации, моделируемой MRF, в классификацию опорных векторов и охватывает как ядра, индуцирующие конечномерные собственные пространства (например, линейные или полиномиальные ядра), так и ядра, индуцирующие бесконечномерные собственные пространства (например, гауссово ядро). В последнем случае интеграция SVM-MRF достигается путем формализации задачи классификации в терминах подходящих случайных процессов с непрерывным и дискретным временем и путем расширения методологических аргументов, которые изначально были введены в цифровых коммуникациях для разработки оптимальных приемников для связи по каналам с аддитивным белым гауссовским шумом.
В этой работе будут рассмотрены разные модификации марковского ядра. Будут представлены экспериментальные результаты работы новых моделей и сравнение с классическими.
В ходе этой работы был написан класс, реализующий модель MRF-SVM и различные настраиваемые схемы соседей, на языке Python. Различные вариации этой модели были протестированы на наборе данных "Artificial Lunar Landscape Dataset". Разные способы охвата контекстной информации были сравнены и было выяснено, что локальные априорные функции энергии, охватывающие большие множества соседей, способны собрать достаточное количество контекстной информации и тем самым повлиять на принятие решения в пользу хуже представленных классов, что улучшает распознование экземпляров таких классов. Рассмотренный подход позволяет успешно решать задачу распознавания неба (точность 91%), грунта (~ 80%) и камней (~ 30%) на изображениях поверхности Луны. При этом удачный выбор схемы позволяет существенно поднять точность распознавания камней — с 26% для SVM до 38%. Таким образом, подобное объединение методов имеет практический смысл и может быть полезно для решения ряда практических задач распознавания объектов на фотографиях.
[1] Gabriele Moser and Sebastiano B. Serpico, “Combining Support Vector Machines and Markov Random Fields in an Integrated Framework for Contextual Image Classification,” IEEE Geosci. Remote Sens., vol. 51, no. 5, pp. 2734-2752, May 2013.
[2] Kaggle [Электронный ресурс]: Artificial Lunar Landscape Dataset. URL: https://www.kaggle.com/romainpessia/artificial-lunar-rocky-landscape- dataset (дата обращения: 22.05.2021).
[3] Chih-Chung Chang and Chih-Jen Lin, “A Library for Support Vector Machines,” ACM TIST, vol. 2, no. 3, article 27, Apr. 2011.
[4] D. A. Landgrebe, “Signal Theory Methods in Multispectral Remote Sensing,” Hoboken, NJ: Wiley, 2003.
[5] G. Camps-Valls and L. Bruzzone, “Kernel Methods for Remote Sensing Data Analysis,” Hoboken, NJ: Wiley, 2009.
[6] P. Mantero, G. Moser, and S. B. Serpico, “Partially supervised classification of remote sensing images using SVM-based probability density estimation,” IEEE Trans. Geosci. Remote Sens., vol. 43, no. 3, pp. 559-570, Mar. 2005.
[7] S. Li, “Markov Random Field Modeling in Image Analysis,” Berlin, Germany: Springer-Verlag, 2009.
[8] S. Geman and D. Geman, “Stochastic relaxation, Gibbs distributions, and the Bayesian restoration,” IEEE Trans. Pattern Anal. Mach. Intell., vol. PAMI-6, no. 6, pp. 721-741, Nov. 1984.
[9] F. Melgani and S. B. Serpico, “A statistical approach to the fusion of the spectral and spatio-temporal contextual information for the classification of remote sensing images,” Pattern Recognit. Lett., vol. 23, no. 9, pp. 1053-1061, Jul. 2002.
[10] A. H. S. Solberg, T. Taxt, and A. K. Jain, “A Markov random field model for classification of multisource satellite imagery,” IEEE Trans. Geosci. Remote Sens., vol. 34, no. 1, pp. 100-113, Jan. 1996.
[11] F. Melgani and S. B. Serpico, “A Markov random field approach to spatiotemporal contextual image classification,” IEEE Trans. Geosci. Remote Sens., vol. 41, no. 11, pp. 2478-2487, Nov. 2003.
[12] G. Moser and S. B. Serpico, “Unsupervised change detection from multichannel SAR data by Markovian data fusion,” IEEE Trans. Geosci. Remote Sens., vol. 47, no. 7, pp. 2114-2128, Jul. 2007.
[13] G. Moser, S. B. Serpico, and G. Vernazza, “Unsupervised change detection from multichannel SAR images,” IEEE Geosci. Remote Sens. Lett., vol. 4, no. 2, pp. 278-282, Apr. 2007.
[14] G. Storvik, R. Fjortoft, and A. H. S. Solberg, “A Bayesian approach to classification of multiresolution remote sensing data,” IEEE Trans. Geosci. Remote Sens., vol. 43, no. 3, pp. 539-547, Mar. 2005.
[15] G. Moser and S. B. Serpico, “Automatic parameter optimization for support vector regression for land and sea surface temperature estimation from remote-sensing data,” IEEE Trans. Geosci. Remote Sens., vol. 47, no. 3, pp. 909-921, Mar. 2009.
...