Актуальность темы исследования и степень ее разработанности. Сегодня компьютерные сети (КС) широко используются для передачи различной информации, контроля и управления различными сервисами в реальном времени, просмотра телепередач, онлайн покупок и т.д. В связи с увеличением новых классов телекоммуникационных устройств и соответствующих сервисов быстрыми темпами увеличиваются объемы информации, передаваемой через сеть Интернет (Интернет-трафик). Например, по данным Cisco Visual Networking Index (наглядные показатели Сети) объемы передаваемого Интернет-трафика увеличились со 100 Г/сутки в 1992 г. до 16 000 Гб/с в 2014 г. При этом существенно усложнилась собственно структура передаваемой информации, которая создается и используется многочисленными пользователями персональных компьютеров, смартфонов, планшетов, телевизоров, бытовой техникой (Интернет вещей) и др.
В этой ситуации закономерно возрастают требования к гибкости и масштабируемости современных КС свойства, которых оказываются существенно отличными от свойств КС с классической архитектурой (по сути, статических). Например, традиционные архитектуры/дизайны КС оказываются неэффективными в динамических средах. При этом классические подходы, ориентированные на распределенное управление устройствами традиционных КС (например, виртуальные сети (VLAN)), не соответствуют современному уровню развития виртуализации серверов и систем хранения данных, а также требованиям крупного бизнеса и сер вис-провайдеров (например, AT&T, Verizon, Google, Facebook, Microsoft и др.). Сложившаяся ситуация в телекоммуникационной отрасли подтверждается, том числе, данными, содержащимися в аналитическом отчете за 2016 г. компании KPMG, где введены понятия «разрушающий трафик» (т.е. трафик таких объемов, с которыми не справляется используемое сетевое оборудование) и «разрушительные технологии», которые создают разрушающий трафик (виртуальная реальность, облачные сервисы, искусственный интеллект, анализ данных в реальном времени и др.).
Для эффективного решения проблем «разрушающего трафика», вопросов проектирования оборудования отвечающего потребностям современных КС, а так же проектирования КС нового поколения, в том числе и виртуальных программно-конфигурируемых сетей - SDN (Software- d efined Networking), необходимо понимать особенности информационных потоков, предаваемых в современных КС, механизмы их взаимодействия друг с другом и влияния на загрузку канала.
Анализ состояния современной теории телетрафика показывает, что имеет место определенный разрыв между современными уровнями развития телекоммуникационных технологий и математических моделей информационных процессов в КС, который, в известной мере, пытаются восполнить большим количеством экспериментальных результатов, проведенных исследований особенностей информационных потоков в КС, в особенности, высокоскоростных магистральных Интернет-каналах (см. работы О.И. Шелухина, В.В. Петрова, Н.Г. Треногина, Е.В. Никульчева, M. Soysal, K. Fukuda, W. Leland, W. Willinger, D. Wilson и др.)
Однако объективный анализ этих работ показал, что проводимые экспериментальные исследования, зачастую, имеют бессистемный характер. Это проявляется: в отсутствии общепринятой методики исследований Интернет-трафика в магистральном высокоскоростном интернет-канале; их направленности не на проверку, но на подтверждение тех или иных изначально выбранных математических моделей Интернет-трафика (в первую очередь, самоподобных моделей).
Цель работы разработка и применение математического и алгоритмического обеспечения для анализа характеристик информационных потоков в высокоскоростных магистральных Интернет-каналах.
Для достижения поставленной цели были поставлены и решены следу ющие основные задачи исследования:
1. Анализ методов исследования информационных потоков в КС сетей с точки зрения их применимости для исследования трафика в высокоскоростных магистральных Интернет -каналах.
2. Разработка программного инструмента, обеспечивающего автоматическое извлечение информации из рсар-файлов в выбранном измерении.
3. Разработка методики анализа первичной информации, извлеченной в соответствующем измерении из рсар-файлов, обеспечивающей получение количественных характеристики информационных потоков, переданных в магистральном высокоскоростном Интернет -канале.
4. Изучение особенностей информационных потоков в магистральном Интернет-канале, создаваемых выбранными классами пользователей («Слоны», «Мулы», «Мыши»), и их взаимного влияния друг на друга.
Научная новизна. В диссертации получены следующие новые научные результаты:
1. Разработано математическое и алгоритмическое обеспечение, а также соответствующее программное обеспечение (ПО) для анализа характеристик информационных потоков в высокоскоростных магистральных Интернет-каналах.
2. Предложена методика анализа Интернет-трафика и доказана ее работоспособность при исследовании информационных потоков в высокоскоростном магистральном Интернет -канале.
3. Проведено исследование взаимного влияния информационных потоков, создаваемых в магистральном Интернет-канале выбранными классами пользователей («Слоны», «Мулы», «Мыши»), и доказано, что связи между объемами информации, переданной в магистральном Интернет-канале каждым из выбранных классов пользователей, описываются детерминированными линейными моделями.
4. Предложен алгоритм управления загрузкой канала передачи информационных потоков позволяющая, за счет отслеживания глобального показателя Херста накопленных сумм случайных последовательностей объема переданной информации класса «Мыши» и соответствующего проактивного ограничения скоростей потоков класса «Слоны» и «Мыши», минимизировать кол -во сбросов скользящего окна для каждого потока, обеспечивая тем самым использование пропускной способности канала близкой к максимальной.
Методология и методы исследования. В работе проведено экспериментальное исследование свойств информационных потоков в высокоскоростных магистральных Интернет - каналов на основе системного подхода с использованием методов математической статистики, генетических алгоритмов и методов анализа временных рядов.
Теоретическая и практическая значимость диссертационного исследования:
1. Создан программно-аппаратный комплекс, обеспечивающий анализ дампов Интернет - трафика, размещенных в pcap-файлов, адаптированный для использования на суперкомпьютере «Уран» Института математики и механики им. академика Н.Н. Красовского УрО РАН.
2. Проведен анализ дампов Интернет-трафика, зарегистрированных в магистральном Интернет-канале, проложенном между США и Японией, результаты которого подтвердили работоспособность разработанной методики анализа Интернет-трафика и созданного программноаппаратного комплекса.
3. Предложен механизм балансировки объемов передаваемой информации, каждым из выделенных классов пользователей («Слоны», «Мулы», «Мыши»), устанавливающий скорость передачи информации для каждого класса пользователей, исходя из значений показателей Херста накопленных сумм зависимостей «мгновенного» числа переданных пакетов, «мгновенного» объема переданной информации, «мгновенного» объема информации, переданной одним пакетом, от времени. (Здесь и далее под «мгновенными» значения понимаются значения соответствующих параметров, подсчитанные в течение заданного временного интервала.)..
1. Проведен анализ методов исследования информационных потоков в КС сетей с точки зрения их применимости для исследования трафика в высокоскоростных магистральных Интернет - каналах, и соответствующих программных инструментов, результаты, которого подтвердили необходимость разработки специализированного математического и алгоритмического программного обеспечения, обеспечивающего автоматическое извлечение информации из pcap- файлов в выбранном измерении.
2. Создан программно-аппаратный комплекс, обеспечивающий извлечение в автоматизированном режиме из дампов трафика, передаваемого в высокоскоростном магистральном Интернет-канале, количественные его количественные характеристики, адаптированный для суперкомпьютера «Уран» ИММ УрО РАН.
3. Разработана методики анализа первичной информации, извлекаемой из pcap-файлов, обеспечивающая получение количественных характеристики информационных потоков, переданных в магистральном высокоскоростном Интернет-канале.
4. Изучены в соответствие с авторской методикой особенности информационных потоков в магистральном Интернет-канале, создаваемых выбранными классами пользователей («Слоны», «Мулы», «Мыши»), и их взаимное влияния друг на друга, в том числе, установлено, что:
4.1. в информационных потоках, создаваемых, классом «Мыши» преобладающими являются пакеты размером не более 200 байт, в информационных потоках, создаваемых, классами «Мулы» и «Слоны» преобладающими являются пакеты размером ~ 1500 байт;
4.2. наиболее стабильными во времени параметры распределения информационных потоков по размеру пакетов в течение недели оказываются у класса пользователей «Слоны» и «Мулы», наименее стабильные - у пользователей класса «Мыши»;
4.3. временные ряды Ni, Vi, Д, содержащие упорядоченные во времени значения числа пакетов и объемов информации, переданных в течение заданного временного интервала, а также среднего объема переданной информации, приходящейся на один пакет. представляют собой случайные последовательности с ограниченной областью рассеяния, накопленные суммы которых обладают свойством самоподобия;
4.4. существует детерминированная линейная связь между объемами информации, переданной в течении 15 минут каждым из классов пользователей, что свидетельствует о возможности создания на основе управления скоростью передачи информации каждого из выделенных классов пользователей механизмов балансировки объемов передаваемой информации , призванных повысить качество обслуживания пользователей данным каналом, и предложена структурная схема подобного алгоритма.
1) Поршнев С.В., Божалкин Д.А. Технология семантического анализа дампа трафика информационных потоков в компьютерных сетях // Информационные технологии. 2014. - №11. - С. 12-19. 0,5 п.л. / 0,25 п.л.
2) Porshnev S.V., Koposov A. S., Bozhalkin D.A. Features of information flows in the backbone Internet-channel: the analysis of the statistical characteristics of the relationship between the number of packets and the time //2015 9th International Conference on Application of Information and Communication Technologies (AICT). - IEEE, 2015. - С. 437-440. 0,25 п.л. / 0,08 п.л. (Scopus, WoS).
3) Porshnev S.V., Koposov A.S., Bozhalkin D.A. The research of a network traffic in a backbone internet channel //2015 International Siberian Conference on Control and Communications (SIBCON). - IEEE, 2015. - С. 1-5. 0,31 п.л. / 0,10 п.л. (Scopus, WoS).
4) Поршнев С.В., Божалкин Д.А. К вопросу о самоподобии трафика, передаваемого в магистральном Интернет-канале // Фундаментальные исследования. - 2016. - № 2(32). - С. 301-310. 0,62 п.л. / 0,31 п.л.
5) Поршнев С.В., Божалкин Д.А., Копосов А.С. Исследование особенностей потоков
сетевого трафика в магистральном интернет-канале // Электросвязь. - 2016. - №2. - С. 16-23.
0,5 п.л. / 0,25 п.л.
6) Поршнев С.В., Божалкин Д.А., Копосов А.С. Опыт использования суперкомпьютера для обработки дампов сетевого трафика магистрального интер нет-канала // Информационные технологии. - 2016. - №1. - С. 42-47. 0,37 п.л. / 0,18 п.л.
7) Porshnev S.V., Bozhalkin D.A. The study of self-similarity of the traffic transmitted in the backbone Internet channel // Dynamics of Systems, Mechanisms and Machines (Dynamics), 2016. - IEEE, 2016. - С. 1-7. 0,43 п.л. / 0,21 п.л. (Scopus, WoS).
8) Поршнев С.В., Божалкин Д.А. О возможности использования случайных величин с ограниченной областью рассеяния для генерации фрактального броуновского движения //Информатика и системы управления. - 2017. - №. 1. - С. 23-32. 0,62 п.л. / 0,31 п.л.
9) Porshnev S.V., Koposov A.S., Bozhalkin D .A. Research of Information Flows Features in the Backbone Internet-Channel: Distribution of Packet Size //2017 IEEE 11th International Conference on Application of Information and Communication Technologies (AICT). - IEEE, 2017. - С. 1-5. 0,31 п.л. / 0,10 п.л. (Scopus, WoS).
Патенты и программы:
10) Поршнев С.В., Божалкин Д.А. Семантический анализатор дампов трафика информационных потоков в компьютерных сетях // Свидетельство о государственной регистрации программы для ЭВМ № 2015611426 (Заявка № 2014662922. Дата поступления 12 декабря 2014 г. Дата государственной регистрации в Реестре программ для ЭВМ 29 января 2015 г.). -1 с.
11) Поршнев С.В., Божалкин Д.А. Анализатор-классификатор информационных потоков дампов трафика компьютерных сетей // Свидетельство о государственной регистрации программы для ЭВМ № 2015661799 (Заявка № 2015618601. Дата поступления 17 сентября 2015 г. Дата государственной регистрации в Реестре программ для ЭВМ 09 ноября 2015 г.). -1 с.
Другие публикации:
12) Поршнев С.В., Божалкин Д.А., Копосов А.С. Особенности информационных потоков в магистральном интернет-канале: анализ статистических характеристик зависимостей объема пакетов от времени //Материалы 25-й Международной Крымской конференция СВЧ-техника и телекоммуникационные технологии. - 2015. - С. 333-336. 0,25 п.л./ 0,08 п.л.
13) Поршнев С.В., Божалкин Д.А., Копосов А.С. Исследование особенностей потоков сетевого трафика в магистральном интернет-канале: распределения размеров пакетов // Современные методы прикладной математики, теории управления и компьютерных технологий (ПМТУКТ-2016) Сборник трудов IX международной конференции. — 2016. — №1. — С. 283-286. 7819062. 0,25 п.л. / 0,08 п.л.
14) Поршнев С.В., Божалкин Д.А., Овечкина Е.В. Анализ взаимного влияния информационных потоков в магистральном интернет -канале // Cloud of science. - 2019. - Т. 6. - №. 1. - С. 83-108. 1,62 п.л. / 0,54 п.л.