Анотация
Введение 4
1 Анализ литературы по проблеме исследования 6
1.1 Обзор литературных источников 6
1.2 Обзор интернет-источников 9
1.3 Обзор рабочей программы дисциплины 10 2 Описание электронного учебного пособия «Основы машинного обучения в
кибербезопасности» 12
2.1 Описание тематики презентаций по теоретическому блоку 12
2.2 Представление презентационного материала 13
2.3 Описание лабораторных работ 30
2.4 Описание интерфейса программного продукта 36
Заключение 39
Список использованных источников 41
Приложение 45
Основная задача науки и реальной жизни — получение правильных предсказаний о будущем поведении сложных систем на основании их прошлого поведения. Многие задачи, возникающие в практических приложениях, не могут быть решены заранее известными методами или алгоритмами. Это происходит по той причине, что нам заранее не известны механизмы порождения исходных данных или же известная нам информация недостаточна для построения модели источника, генерирующего поступающие к нам данные. Как говорят, мы получаем данные из «черного ящика». В этих условиях ничего не остается, как только изучать доступную нам последовательность исходных данных и пытаться строить предсказания совершенству нашу схему в процессе предсказания. Подход, при котором прошлые данные или примеры используются для первоначального формирования и совершенствования схемы предсказания, называется методом машинного обучения.
Машинное обучение — чрезвычайно широкая и динамически развивающаяся область исследований, использующая огромное число теоретических и практических методов. В данной курсовой работе ознакомимся с некоторыми современными математическими проблемами данной области и их решениями, основной из которых является проблема построения и оценка предсказаний будущих исходов. С данным подходом тесно связана задача универсального предсказания. В том случае, когда мы не имеем достаточной информации для того чтобы построить модель источника генерирующего наблюдаемые данные, нам приходится учитывать как можно более широкие классы таких моделей и строить методы, которые предсказывают «не хуже» чем любая модель из данного класса. Понятие универсального предсказания, которое первоначально возникло в теории предсказаний стационарных источников, в настоящее время вышло далеко за рамки этой теории.
Объектом исследования данной выпускной квалификационной работы является процесс обучения студентов дисциплине «Интеллектуальные средства защиты информации».
Предметом выпускной квалификационной работы — учебный материал для дисциплины «Интеллектуальные средств защиты информации» по теме «Основы машинного обучения в области кибербезопасности».
Цель работы — разработать электронное учебное пособие «Основы машинного обучения в области кибербезопасности».
Для реализации поставленной цели необходимо решить следующие задачи:
• проанализировать литературу и интернет-источники по машинному обучению, с целью систематизации и структурирования собранного материала;
• проанализировать рабочую программу;
• разработать презентационный материал и лабораторные работы по введению в машинное обучение;
• реализовать электронное учебное пособие.
Машинное обучение — это направление в науке, а с недавних пор и в технологиях, которое решает задачу обучения компьютера. Сразу хочу отметить, что не предполагается никакого полноценного обучения, которое можно было бы сравнить с обучением человека. Машинное знание, которое сформировалось в процессе обучения, не может принимать по-настоящему интеллектуальных решений, как это может сделать человек. И, несмотря на это, в последнее время потребность в машинном обучении резко выросла. Машинное обучение выходит из сферы только математиков и алгоритмистов, и все глубже проникает в мир IT-бизнесменов, а затем и в мир простых обывателей. С одной стороны, это приносит человеку огромную пользу, а с другой — может в скором времени бросить вызов каждому из нас.
Поэтому, посчитали, что эта тема достаточно актуальна в наше время. Также очень интересной, потому что, эта тема новая, но за короткий отрезок времени проникла во многие сферы жизни. Про машинное обучение говорят уже в:
1. IT-сфере: разработка приложений.
2. Рекламных компаниях.
3. Маркетинговых исследованиях.
4. Медицинской диагностике.
5. Технической диагностике.
6. Биоинформатике и во многих других сферах.
Один из первых алгоритмов машинного обучения, искусственная нейронная сеть, был изобретен в 1950-х годах. Тогда казалось, что с помощью этого алгоритма можно будет вот-вот создать «сильный» искусственный интеллект, т.е. такой, который в состоянии мыслить, осознавать себя и решать не только те задачи, на которые запрограммирован. В противовес ему есть «слабый» искусственный интеллект — он может решать некоторые творческие задачи: распознавать образы, предсказывать погоду, играть в шахматы и т.п. Теперь, спустя 60 лет гораздо лучше понимается, что до создания настоящего искусственного интеллекта ещё долго, а то, что сегодня называют искусственным интеллектом, является машинным обучением.
Для реализации поставленной цели были решены следующие задачи:
• проанализирована литература и интернет-источники по машинному обучению, с целью систематизации и структурирования собранного материала;
• проанализирована рабочая программа;
• разработан презентационный материал и лабораторные работы по введению в машинное обучение;
• реализовано электронное учебное пособие.
Таким образом, задачи решены, цель работы — разработать электронное учебное пособие «Основы машинного обучения в области кибербезопасности» — достигнута.
1. Алгоритмы создания дерева принятия решений [Электронный ресурс]. — Режим доступа: http://econf.rae.ru/pdf/2014/03/3245.pdf (дата обращения: 20.04.2018).
2. Алпайдин Э. Машинное обучение: новый искусственный интеллект [Текст]/Э. Алпайдин — Москва: Издательская группа «Точка», 2017. — 208 с.
3. Баргесян А. А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP [Текст] /А. А. Баргесян, М. С. Куприянов, В. В. Степаненко, и т. д. — 2-е изд., перераб. и доп. — Санкт-Петербург: БХВ- Петербург, 2007. — 384 с.
4. Бринк Х. Машинное обучение [Текст] / Х. Бринк, Дж. Ричардс, М. Феверолф. — пер. с англ. И. Рузмайкина — Санкт-Петербург: Питер, 2017. — 336 с.
5. Васильев В. И. Интеллектуальные системы защиты информации [Текст]: учебное пособие / В. И. Васильев — Изд. 2-е, испр. — Москва: Машиностроение, 2012. — 171 с.
6. Видеолекции курса «Машинное обучение» [Электронный ресурс]. — Режим доступа: https://yandexdataschool.ru/edu-
process/courses/machine-learning#item-1 (дата обращения: 24.04.2018).
7. Вьюгин В. В. Математические основы теории машинного обучения и прогнозирования [Текст]/В. В. Вьюгин. — Москва: Издательство Московского центра непрерывного математического образования (МЦНМО) 2013. — 305 с.
8. Генрихов И. В. Построение и исследование полных решающих деревьев для задач классификации по прецедентам [Электронный ресурс]. — Режим доступа: http://www.ccas.ru/avtorefe/101avtor.pdf (дата обращения: 20.04.2018).
9. Деревья решений — общие принципы работы [Электронный ресурс]. — Режим доступа: https://basegroup.ru/community/articles/description (дата обращения: 15.04.2018).
10. Загинайлов Ю. Н. Теория информационной безопасности и методология защиты информации. Курс лекций. [Текст] / Ю. Н. Загинайлов. — Барнаул: Алтайский государственный технический университет им. И.И. Ползунова, 2010. — 104 с.
11. Знакомство с машинным обучением [Электронный ресурс]. — Режим доступа: https://www.google.ru/about/main/machine-learning-qa/ (дата обращения: 08.04.2018).
12. Искусство анализа данных: взгляд изнутри [Электронный ресурс]. — Режим доступа: https://www.osp.ru/cio/2018/02/13054071/ (дата обращения: 08.04.2018).
13. Логистическая регрессия и ROC-анализ — математический аппарат [Электронный ресурс]. — Режим доступа: https://basegroup.ru/community/articles/logistic (дата обращения: 01.04.2018).
14. Машинное обучение — это легко [Электронный ресурс]. Режим доступа: https://habr.com/post/319288/ (дата обращения: 08.03.2018).
15. Машинное обучение [Электронный ресурс]. — Режим доступа: http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение (дата обращения: 24.03.2018)....30