Тип работы:
Предмет:
Язык работы:


ИССЛЕДОВАНИЕ АЛГОРИТМОВ РЕШЕНИЯ ЗАДАЧИ ФИЛЬТРАЦИИ СПАМА

Работа №22412

Тип работы

Главы к дипломным работам

Предмет

математика

Объем работы68
Год сдачи2016
Стоимость7300 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
524
Не подходит работа?

Узнай цену на написание


Введение 4
1. Задача фильтрации спама 6
1.1 Основные подходы к решению задачи фильтрации спама 6
1.2 Постановка задачи 8
2. Наивный байесовский классификатор 9
2.1 Характеристика метода 9
2.2 Описание принципа работы наивного байесовского классификатора ... 11
2.3 Многомерная модель наивного байесовского классификатора 15
2.4 Мультиномиальная модель наивного байесовского классификатора 17
3. Метод классификации на основе модели мешка слов 19
4. Практический пример задачи фильтрации спама 20
4.1 Результаты решения практической задачи 20
4.2 Результаты работы программы, решающей практическую задачу многомерным наивным байесовским классификатором на тестовых письмах .. 23
4.3 Результаты работы программы, решающей практическую задачу мультиномиальным наивным байесовским классификатором на тестовых письмах 25
4.4 Результаты работы программы, решающей практическую задачу
методом, основанным на модели «мешка слов» на тестовых письмах 27
5. Сравнительный анализ методов 31
5.1 По вычислительной сложности 31
5.2 По результатам работы 31
Заключение 41
Список использованных источников 42


Одним из самых востребованных направлений в области защиты информации является разработка методов фильтрации потока электронной почты. В настоящее время электронная почта стала одним из наиболее распространенных средств связи, управления и бизнеса. Она достаточно совершенна в техническом отношении и представляет собой недорогую альтернативу привычным средствам связи.
Вместе с развитием электронной почты увеличивается и количество угроз ее нормальному функционированию. Наиболее серьезной и важной проблемой стал так называемый спам.
Спам (англ. spam)- массово распространяемые рекламные материалы или подобные коммерческие виды сообщений лицам, не выражавшим желания их получать.
Целью работы является исследование и реализация основных алгоритмов решения задачи фильтрации спама.
В работе приводится постановка задачи фильтрации спама, которая является частным случаем задачи классификации данных. Рассматриваются основные подходы к решению задачи фильтрации.
Особое внимание уделяется одному из наиболее востребованных методов классификации - наивному байесовскому классификатору. Данный метод выполняет анализ текстовых данных, что позволяет использовать его для нахождения решения поставленной задачи фильтрации спама. В работе рассматриваются две разновидности байесовского классификатора: на основе многомерной и мультиномиальной модели.
В работе предлагается новый метод фильтрации данных на основе модели «мешка слов».
Проводится сравнение вышеперечисленных методов по вычислительной сложности и точности нахождения решения.
В работе решается практическая задача фильтрации спама - выполняется классификация электронных писем на основании их содержимого. Данная задача решается с помощью байесовского классификатора и предложенного метода. Проводится визуализация результатов работы методов, и анализируются полученные итоги.
Разработано программное приложение, реализующее работу трёх вышеперечисленных алгоритмов фильтрации спама.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В работе получены следующие результаты:
• Изучены методы фильтрации спама: байесовский классификатор на основе многомерной и мультиномиальной модели.
• Разработан метод фильтрации спама - метод классификации на основе модели мешка слов.
• Создано программное приложение, реализующее вышеперечисленные алгоритмы фильтрации спама.
• Проведены вычислительные эксперименты по сравнению вычислительной сложности реализованных методов и результатов их работы.
• Решена практическая задача фильтрации спама.
• Проведен анализ результатов решения практической задачи, полученных рассматриваемыми методами.
Результаты работы опубликованы на международной научно-технической конференции студентов, аспирантов и молодых ученых «Проспект Свободный - 2015» (Красноярск, 2015), международной научно-технической конференции студентов, аспирантов и молодых ученых «Проспект Свободный - 2016» (Красноярск, 2016).



1. Воронцов, К. В. Лекции по алгоритмам кластеризации и многомерного шкалирования / К. В. Воронцов. Москва: МГУ, 2007. - 18 с.
2. Дюран, Б. Кластерный анализ: пер. с англ. Е. З. Демиденко под ред. А. Я. Боярского / Б. Дюран, П. Одел. Москва: «Статистика», 1977. - 128 с.
3. Загоруйко, Н. Г. Прикладные методы анализа данных и знаний / Н. Г. Загоруйко. Новосибирск: ИМ СО РАН, 1999. - 270 с.
4. Лепский, А. Е. Математические методы распознавания образов / А. Е. Лепский, А. Г. Броневич. Таганрог: Изд-во ТТИ ЮФУ, 2009. - 155 с.
5. Местецкий, Л. М. Математические методы распознавания образов / Л. М. Местецкий. Москва: МГУ, 2002. - 139 с.
6. Миркин, Б. Г. Методы кластер - анализа для поддержки принятия решений: обзор: препринт WP7/2011/03/ Б. Г. Миркин. Москва: Изд. Дом Национального исследовательского университета «Высшая школа экономики», 2011. - 88 с.
7. Мэннинг, К. Введение в информационный поиск / К. Мэннинг, П. Рагхаван, Х. Шютце. Москва: Вильямс, 2011. - 163 с.
8. Потапов, А. С. Распознавание образов и машинное восприятие / А. С. Потапов. Москва: "Политехника", 2007. - 552 с.
9. McCallum, A. A comparison of event models for naive bayes text classifcation / A. McCallum, K. Nigam. AAAI-98 workshop on learning for text categorization, 1998. - 41 с.
10. Ветров, Д. П. Спецкурс «Байесовские методы машинного обучения». Лекция 2 «Вероятностная постановка задач классификации и регрессии. Байесовские решающие правила. Обобщенные линейные модели» / Д. П. Ветров, Д. А. Кропотов. [Электронный ресурс] - Режим доступа: http://www.machineleaming.rU/wiki/images/7/78/BayesML-2009-2a.pdf
11. Кулистов, А. В. Задача кластеризации данных и её решение методами к- средних и Ланса-Уильямса / А. В. Кулистов // Сборник материалов международной конференции студентов, аспирантов и молодых ученых «Проспект Свободный-2015», г. Красноярск, СФУ, 2015. - с. 24-28.
12. Кулистов, А. В. Методы фильтрации спама / А. В. Кулистов // Сборник материалов международной научно-технической конференция студентов, аспирантов и молодых учёных «Проспект Свободный-20 16» г. Красноярск, 2016. - 31 с.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ