Введение 3
Теоретические основы 5
Предмет, терминология, области применения 5
Понятие стегоанализа 7
Принципы построения стеганографических систем 8
Описание формата DOCX 8
Обзор существующих методов скрытия данных в текстовых файлах 10
Методы произвольного интервала 10
Синтаксические и семантические методы 12
Другие методы скрытия данных в тексте 14
Методы скрытия в файлах формата DOCX 16
Разработка и реализация метода скрытия 21
Описание метода 21
Программная реализация метода 24
Анализ результатов работы метода 30
Статистический анализ 31
Области применения метода 35
Заключение 37
Список литературы и источников 38
Приложение 40
Стеганография - наука о скрытии факта передачи информации, известная с древности. В наше время, бурное развитие каналов передачи данных привело к созданию новых методов стеганографии, основанных на особенностях представления информации в компьютерных файлах. Такой вид стеганографии называют компьютерной стеганографией. Из технического искусства компьютерная стеганография превратилась в научную область исследования, и получила статус прикладной науки о способах и методах скрытия секретных сообщений. Методы современной компьютерной стеганографии применяются в военной и правительственной связи, в области защиты авторских прав, используются для обеспечения информационной безопасности.
Большое развитие получили методы скрытия данных в изображениях, видео и аудио файлах. В то же время возможности стеганографии в текстовых файлах исследовались довольно медленно. Во многом это связано с особенностями представления информации в виде текста и сложностями, возникающими при попытке встраивания сообщений. Многие существующие методы скрытия данных в текст не являются надежными и заключаются лишь в изменении какой-либо характеристики символов текста (шрифта, алфавита, цвета и др.) или свободного места в строке (пробелы, отступы, интервалы и др.).
Преодолеть недостатки скрытия в тексте поможет использование его представления на компьютере - осуществлять скрытие можно в текстовые файлы разных форматов. В стандартах форматов можно найти различные особые места для размещения в них скрытой информации. Однако такие «форматные» методы развиты слабо. Поэтому в данной работе будет предложен новый метод, использующий особенности формата DOCX текстовых файлов. Данный формат чаще всего применятся для создания деловых и личных документов и является одним из самых популярных форматов для текстовых редакторов. Объектом настоящего исследования являются возможности скрытия информации в текстовые файлы формата DOCX.
Целями данной работы являются реализация в виде программы нового метода стеганографии в текстовых файлах и обоснование надежности этого метода.
В соответствие поставленным целям задачами данной работы являются:
• проведение обзора существующих методов стеганографии в текстовых файлах;
• разработка и описание алгоритма метода скрытия данных в DOCX файлы;
• реализация разработанного метода на языке программирования в виде программы с пользовательским интерфейсом;
• проведение анализа результатов работы метода.
В результате выполнения работы были решены все поставленные задачи:
• проведен обзор существующих методов встраивания данных в текстовые файлы. Рассмотренные методы не обладают достаточной надежностью и не могут быть использованы для скрытой передачи информации;
• предложен и реализован в виде программы с пользовательским
интерфейсом новый метод скрытия, встраивающий данные в файлы формата DOCX. Метод представлен в двух вариантах: с
использованием ключа и без ключа;
• для реализованного метода проведен статистический анализ результатов его работы. Установлено, что применение предлагаемых преобразований с использованием секретного ключа не изменяет статистические характеристики оригинальных файлов.
В работе предложены области использования разработанного метода: это не только скрытая передача сообщений, но и своеобразная подпись документов, свидетельствующая об их целостности, а также, как дополнение к используемым DLP-системам.
В качестве дальнейших исследований можно предположить проведение других статистических тестов и методов стегоанализа, направленных на выявление присутствия в DOCX файле следов встраивания сообщений предложенным методом.
1. Simmons G. The prisoners’ problem and the subliminal channel. In Advances in Cryptology Proceedings of Crypto 83. Plenum Press, 1984, P. 51-67.
2. Конахович Г.Ф., Пузыренко А.Ю. Компьютерная стеганография. Теория и практика. - К.: «МК-Пресс», 2006. - 288 с., ил.
3. Standard ECMA-376 3rd edition, Office Open XML Formats, 05.2016.
4. Winstein K. Tyrannosaurus lex 1999. [Электронный ресурс]. - Режим доступа: http://alumni. imsa.edu/~keithw/tlex/
5. Barzilay R., Lee L. Learning to paraphrase: An Universal approach using multiple-sequence alignment. [Электронный ресурс]. - Режим доступа: http://www.aclweb.org/anthology/NZN03/N031003.pdf/
6. Урбанович Н., Пласковицкий В. Метод текстовой стеганографии на основе модификации цветовых координат символов. [Электронный ресурс]. - Режим доступа: http://gc2011.graphicon.ru/files/gc2011 /proceedings/conference/gc2011urbanovich.pdf/
7. R. Vill'an, S. Voloshynovskiy. Text data-hiding for digital and printed
documents: Theoretical and Practical Considerations. [Электронный ресурс]. - Режим доступа: http://cvml.unige.ch/publications/
postscript/2006/SPIE-EI-2006-Text-Data-Hiding-paper.pdf /
8. Francesco Palmieri. Hiding Information into OOXML Documents: New Steganographic Perspectives. / Journal of Wireless Mobile Networks, volume: 2, number: 4, pp. 59-83. [Электронный ресурс]. - Режим доступа: http://jowua.yolasite.com/vol2no4.php/
9. K.Kaczyski. Stego.docx - hidden communication system using docx files. [Электронный ресурс]. - Режим доступа: http://yadda.icm.edu.pl/ baztech/element/bwmeta1.element.baztech-article-BWAD-0031 -0020/
10. Б.Шнайер. Прикладная криптография. Протоколы, алгоритмы, исходные тексты на языке Си - М.: Триумф, 2002. - 816 с.
11. Грибунин В.Г., Оков И.В., Туринцев И.В. Цифровая стеганография. - М.: СОЛОН-ПРЕСС, 2009. - 272с.