📄Работа №217207

Тема: Исследование и реализация алгоритма поиска ассоциативных правил в большом наборе данных

📝
Тип работы Бакалаврская работа
📚
Предмет Прикладная информатика
📄
Объем: 40 листов
📅
Год: 2025
👁️
Просмотров: 5
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Введение 5
Глава 1 Постановка задачи исследования алгоритма поиска ассоциативных правил в большом наборе данных 7
1.1 Математическое описание задачи поиска ассоциативных правил в
большом наборе данных 7
1.2 Методы поиска ассоциативных правил 9
Глава 2 Обзор и анализ алгоритмов поиска ассоциативных правил 15
Глава 3 Реализация и тестирование алгоритма поиска ассоциативных правил в большом наборе данных 22
3.1 Выбор средства разработки программы 22
3.2 Реализация и тестирование алгоритма 26
Заключение 35
Список используемой литературы и используемых источников 38

📖 Введение

Точное, полное и быстрое определение потребностей клиентов и наличие рекомендаций по товарам и услугам являются решающими моментами с точки зрения повышения уровня удовлетворенности клиентов в различных областях человеческой деятельности.
Из-за значительного увеличения количества транзакций и клиентов анализ затрат по времени и потреблению компьютерной памяти становится выше. Чтобы повысить производительность рекомендаций по товарам и услугам используется подход, основанный на поиске и анализе правил ассоциации в больших наборах данных. «Для решения данной задачи используется методы и алгоритмы интеллектуального анализа данных, направленные на выявление часто встречающихся закономерностей, корреляций или ассоциаций в наборах данных в различных реляционных и транзакционных базах данных.
Алгоритм поиска ассоциативных правил в машинном обучении имеют решающее значение для извлечения ценной информации из данных, особенно в сценариях, где традиционные математические подходы могут оказаться непригодными» [10].
Актуальность темы исследования и реализации алгоритмов поиска ассоциативных правил в больших наборах данных обусловлена их широким применением в различных сферах, необходимостью обработки растущих объемов данных и развитием технологий анализа данных. Разработка эффективных алгоритмов и их оптимизация для работы с большими данными являются важными задачами, которые имеют как научное, так и практическое значение.
Объектом исследования бакалаврской работы является большой набор данных.
Предметом исследования бакалаврской работы является алгоритм поиска ассоциативных правил.
Цель бакалаврской работы - исследование и программная реализация алгоритма поиска ассоциативных правил в большом наборе данных.
Для достижения данной цели необходимо выполнить следующие задачи:
- выполнить постановку задачи исследования алгоритма поиска ассоциативных правил в большом наборе данных;
- проанализировать алгоритмы поиска ассоциативных правил в большом наборе данных;
- разработать и протестировать программу, реализующую алгоритм поиска ассоциативных правил в большом наборе данных.
«Методы исследования - методы интеллектуального анализа данных (Data mining), методы и технологии разработки программного обеспечения» [10].
Практическая значимость бакалаврской работы заключается в разработке программы, позволяющий производить поиск ассоциативных правил в большом наборе данных.
Данная работа состоит из введения, трех глав, заключения, списка используемой литературы и используемых источников.
Выпускная квалификационная работа состоит из 40 страниц текста, 20 рисунков, 3 таблиц и 25 источников.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

«В современном мире объемы данных, генерируемых в различных областях (например, электронная коммерция, социальные сети, финансы, здравоохранение), растут экспоненциально. Это требует разработки эффективных методов анализа больших данных для извлечения полезной информации» [2].
Актуальность темы исследования и реализации алгоритмов поиска ассоциативных правил в больших наборах данных обусловлена их широким применением в различных сферах, необходимостью обработки растущих объемов данных и развитием технологий анализа данных. Разработка эффективных алгоритмов и их оптимизация для работы с большими данными являются важными задачами, которые имеют как научное, так и практическое значение.
Выполненные в рамках бакалаврской работы задачи представлены следующими основными результатами:
- произведена постановка задачи исследования алгоритма поиска ассоциативных правил в большом наборе данных. Использование ассоциативных правил позволяет компаниям повышать эффективность бизнес-процессов, оптимизировать ресурсы и увеличивать прибыль. Например, рекомендательные системы на основе ассоциативных правил увеличивают продажи и улучшают пользовательский опыт. Методы поиска ассоциативных правил - это техники, используемые для выявления интересных взаимосвязей и закономерностей в больших наборах данных, особенно в контексте анализа данных и машинного обучения. Методы поиска ассоциативных правил играют важную роль в анализе данных и могут быть применены в различных областях, таких как маркетинг, розничная торговля, биоинформатика и другие. Выбор конкретного метода поиска ассоциативных правил зависит от характера данных, объема данных и требований к эффективности;
- дан обзор и произведен анализ алгоритмов поиска ассоциативных правил. Ручной анализ больших объемов данных становится невозможным из-за их сложности и масштаба. Алгоритмы поиска ассоциативных правил позволяют автоматизировать процесс выявления полезных паттернов, что экономит время и ресурсы. «По результатам сравнения для поиска ассоциативных правил в больших наборах данных выбран алгоритм Apriori. Apriori использует принцип антимонотонности: если набор элементов не является частым, то все его надмножества также не могут быть частыми. Это позволяет значительно сократить пространство поиска» [14].
Благодаря этому свойству, алгоритм избегает полного перебора всех возможных комбинаций, что особенно важно для больших наборов данных. Данный алгоритм может сократить количество рассматриваемых кандидатов, исследуя только те наборы элементов, количество поддержки которых больше минимального количества поддержки. «Apriori стал основой для разработки многих других алгоритмов поиска ассоциативных правил (например, FP-Growth). Его идеи и принципы используются в более современных и оптимизированных методах. Для повышения эффективности алгоритма Apriori разработаны его модификации AprioriTid и AprioriHybrid» [14];
- выполнены реализация и тестирование алгоритма поиска ассоциативных правил в большом наборе данных. «Для реализации программ выбраны язык Python и среда Jupyter Notebook. Для реализации классического алгоритма Apriori на первом этапе использован модуль Apyori - это простая реализация алгоритма Apriori на Python, предоставляемая в виде API и интерфейсов командной строки. Модуль Apyori состоит всего из одного файла и не зависит от других библиотек, что позволяет использовать его в переносимом виде и может быть использован в качестве API» [16]. Для повышения эффективности анализа больших наборов данных на втором этапе использован модифицированный Apriori из библиотеки MLxtend.
Таким образом, Классический алгоритм Apriori недостаточно эффективен при работе с большими массивами данных. Поэтому на следующем этапе использована его эффективная модификация на основе метода FP-Growth. Тестирование подтвердило высокую эффективность данного алгоритма.
Результаты бакалаврской работы могут представлять интерес для разработчиков и специалистов, занимающимся исследованием и реализацией алгоритмов поиска ассоциативных правил в больших наборах данных.
Исследование и реализация алгоритмов поиска ассоциативных правил вносят вклад в развитие теории анализа данных и машинного обучения.
Практическая реализация таких алгоритмов позволяет решать реальные задачи в различных отраслях.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Ассоциативные правила. Сравнительный анализ инструментария [Электронный ресурс]. URL: http://swsys-web.ru/printable_version/178.html(дата обращения: 12.11.2024).
2. Введение в анализ ассоциативных правил [Электронный ресурс]. URL: https://loginom.ru/blog/associative-rules(дата обращения: 12.11.2024).
3. Дроботун Н. В. Алгоритмизация и программирование. Язык Python : учебное пособие / Н. В. Дроботун, Е. О. Рудков, Н. А. Баев. Санкт-Петербург : СПбГУПДТ, 2020. 119 c. URL: https://www.iprbookshop.ru/102400.html(дата обращения: 29.11.2024).
4. Как повысить продуктивность при анализе данных? 25 неочевидных инструментов [Электронный ресурс]. URL: https://proglib.io/p/kak-povysit- produktivnost-pri-analize-dannyh-25-neochevidnyh-instrumentov-2020-01-16#(дата обращения: 12.11.2024).
5. Методы поиска ассоциативных правил [Электронный ресурс]. URL:
https://intuit.ru/studies/courses/6/6/lecture/186?page=3 (дата обращения: 12.11.2024).
6. Пальмов С. В., Французова Е. Н. Алгоритмы поиска ассоциативных
правил // Теория и практика современной науки. 2016. №3 (9). URL:
https://cyberleninka.ru/article/n/algoritmy-poiska-assotsiativnyh-pravil (дата
обращения: 29.11.2024).
7. Реляционные базы данных и OLAP-технологии [Электронный ресурс]. URL: https://km.mmf.bsu.by/(12.11.2024).
8. Седова Е. Н. Ассоциативные правила в социально-экономических и экологических исследованиях : учебное пособие / Е. Н. Седова, А. В. Раменская, Р. М. Безбородникова. Оренбург : ОГУ, ЭБС АСВ, 2015. 171 c. URL: https://www.iprbookshop.ru/52315.html(дата обращения: 29.11.2024).
9. Сузи Р. А. Язык программирования Python : учебное пособие. М.:
ИНТУИТ, Ай Пи Ар Медиа, 2020. 350 c. URL: https://www.iprbookshop.ru/97589.html(дата обращения: 12.11.2024).
10. Чубукова И. А. Data Mining : учебное пособие / И. А. Чубукова. — 4¬е изд. М. : ИНТУИТ, Ай Пи Ар Медиа, 2024. 469 c. URL:
https://www.iprbookshop.ru/133907.html(дата обращения: 29.11.2024).
11. FP Growth Algorithm in Data Mining [Электронный ресурс]. URL:
https://www.javatpoint.com/fp-growth-algorithm-in-data-mining (дата
обращения: 12.11.2024).
12. Generalized Sequential Pattern (GSP) Mining in Data Mining [Электронный ресурс]. URL: https://www.geeksforgeeks.org/generalized- sequential-pattern-gsp-mining-in-data-mining/(12.11.2024).
13. Jupyter Notebook: The Classic Notebook Interface [Электронный ресурс]. URL: https://jupyter.org/ (12.11.2024).
14. Lungu I, Pirjan A. Research issues concerning algorithms used for
optimizing the data mining process [Электронный ресурс]. URL: https://www.researchgate.net/publication/227487186 дата обращения: (12.11.2024).
15. Maximal Frequent Itemsets [Электронный ресурс]. URL:
https://www.geeksforgeeks.org/maximal-frequent-itemsets/ (12.11.2024).
16. Power Python [Электронный ресурс]. URL:
https://pypi.org/project/apyori/(дата обращения: 12.11.2024).
17. Rai A. An Overview of Association Rule Mining &its Applications [Электронный ресурс]. URL: https://www.upgrad.com/blog/association-rule- mining-an-overview-and-its-applications/(дата обращения: 12.11.2024).
18. Replit.com[Электронный ресурс]. URL: https://replit.com/~(дата обращения: 12.11.2024).
19. Sleep Health and Lifestyle Dataset [Электронный ресурс]. URL: https://www.kaggle.com/datasets/uom190346a/sleep-health-and-lifestyle-dataset(дата обращения: 12.11.2024).
20. Trupti A. Kumbhare et al. An Overview of Association Rule Mining Algorithms / (IJCSIT) International Journal of Computer Science and Information
Technologies, Vol. 5 (1), 2014, 927-930.
21. Unified Modeling Language (UML) Diagrams [Электронный ресурс]. https://www.geeksforgeeks.org/unified-modeling-language-uml-introduction/(дата обращения: 12.11.2024).
22. Visual Paradigm [Электронный ресурс]. URL: https://online.visual- paradigm.com/(дата обращения: 12.11.2024).
23. Wang Yanbo et al. Research of AprioriHybird algorithm and application in network situational awareness, 2010, 3rd International Conference on Computer Science and Information Technology, Chengdu, 2010, pp. 170-172.
24. What is association rule mining? [Электронный ресурс]. URL:
https://www.educative.io/answers/what-is-association-rule-mining (дата
обращения: 12.11.2024).
25. Yuh-Jiuan Tsay, Jiunn-Yann Chiang, CBAR: an efficient method for mining association rules, Knowledge-Based Systems, Volume 18, Issues 2-3, 2005, Pages 99-105.

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @disshelp_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ