Введение 3
Глава 1. Стегоанализ JPEG-изображений 5
Постановка задачи 7
Обзор существующих методов 9
Глава 2. Стегоанализ JPEG-изображений на основе локальных характеристик 10
Ансамбли классификаторов 10
Выбор модели изображения 11
Классификаторы DCT-коэффициентов 12
Первый подход 12
Второй подход 13
Классификатор для изображения 14
Вычисление векторов характеристик 14
Сверточные нейронные сети 16
Классификация изображения 17
Классификация локальных объектов 18
Глава 3. Эксперименты и результаты 20
Предварительные вычисления 20
Эксперименты 20
Ансамбли классификаторов 20
Сверточные нейронные сети 22
Результаты 29
Ансамбли классификаторов 29
Сверточные нейронные сети 29
Заключение 30
Список литературы 32
Приложение
Современные информационные технологии сделали возможным осуществление быстрой передачи большого количества данных от одного источника к другому. Это, в свою очередь, дало людям возможность передавать сообщения, встроенные в цифровые объекты с помощью специальных алгоритмов так, чтобы было невозможно установить сам факт встраивания. Стеганография - это наука, которая разрабатывает и анализирует подобные методы скрытого встраивания сообщений в цифровые объекты.
Так как стеганографические алгоритмы могут быть применены при организации террористических актов, промышленном шпионаже, передаче информации государственной важности и т.д., чрезвычайно важно уметь распознавать наличие встраивания информации. Это есть не что иное, как проблема пассивного стегоанализа.
Задача стегоанализа заключается в обнаружении, уничтожении или изменении информации, встроенной стеганографическим методом. Пассивный стегоанализ - это распознавание встраивания информации без ее изменения.
Большая часть данных, содержащихся в Интернете, представлена в виде изображений в различных форматах. Одним из самых популярных форматов изображений, в свою очередь, является формат JPEG, поэтому стегоанализ JPEG-изображений является очень актуальной задачей. Современный подход к построению пассивных стегоаналитических атак состоит из двух частей: определение модели цифрового объекта и построение бинарного классификатора, определяющего наличие встроенного сообщения в объект.
Данная работа посвящена методу пассивного стегоанализа JPEG-изображений, в основе которого лежит идея принятия решения исходя из значений локальных характеристик цифрового объекта. Как известно, JPEG-изображения состоят из блоков пикселей размера 8 х 8 (см. Рис. 1), подвергнутых дискретно-косинусному преобразованию (Discrete Cosine Transform, DCT). В качестве локальных характеристик в случае JPEG-изображения принято рассматривать значения DCT-коэффициентов. Современные методы пассивного стегоанализа базируются на вычислении статистических показателей по всему изображению, однако в этом подходе есть очевидный недостаток: при усреднении значений вычисляемых характеристик часть значимой информации теряется. Предполагается, что использование локальных характеристик позволит добиться более эффективного распознавания, чем при использовании статистических моделей изображения. Подтверждение этой гипотезы и является целью данной работы.
В данной работе был предложен новый метод пассивного стегоанализа JPEG- изображений, основанный на вычислении локальных характеристик цифровых изображений. Было представлено четыре подхода к решению данной проблемы: первые два подхода основаны на использовании ансамблей классификаторов - сбалансированных и несбалансированных, третий подход базируется на классификации локальных объектов изображения с помощью свёрточных нейронных сетей, в четвертом подходе свёрточная нейронная сеть используется для классификации всего изображения.
Ряд экспериментов показал, что методы, основанные на вычислении локальных характеристик, не позволяют достичь приемлемой точности классификации. Все вышеуказанные методы, за исключением подхода с использованием CNN для классификации всего изображения, позволяют обнаруживать наличие встроенной в JPEG-изображение информации с точностью, существенно меньшей, чем метод, основанный на использовании Rich Model.
С другой стороны, исходя из результатов экспериментов можно заключить, что использование свёрточных нейронных сетей для классификации непосредственно изображений позволяет построить достаточно точный классификатор. Этот многообещающий результат вызывает интерес к дальнейшим исследованиям в данной области. В частности, в данной работе были использованы лишь свёрточные нейронные сети стандартной архитектуры в силу ресурсоемкости и длительности процесса их обучения; имеет смысл исследовать эффективность данного подхода при использовании других архитектур.