Тип работы:
Предмет:
Язык работы:


Использование нейросетевых методов в прикладных задачах определения мошенничества

Работа №149982

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы33
Год сдачи2024
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
15
Не подходит работа?

Узнай цену на написание


Введение 4
Постановка задачи 6
Обзор литературы 7
Глава 1. Математическая постановка задачи 11
1.1. Мошенники на сайтах-агрегаторах отзывов 11
1.2. Пространственная парадигма 12
1.3. Спектральная парадигма 15
1.4. Трансформеры 17
Глава 2. Эксперименты 19
2.1. Описание используемых наборов данных 19
2.2. Метрики 21
2.3. Эксперименты 23
2.4. Сравнение результатов 26
Выводы 28
Заключение 29
Список литературы 31


С каждым днем цифровое пространство все больше интегрируется в
нашу повседневную жизнь. В современной экономике наблюдается рост влияния мошенничества, обусловленный быстрым развитием финансовых технологий, таких как необанкинг, и широким распространением социальных
сетей и мессенджеров.
Согласно оценкам Центрального банка России [2], только за 2023-й год
общий объем операций без согласия клиентов достиг рекордных 15.8 млрд.
рублей, что на 11.48% превысило статистику предшествующего года. Более
половины таких транзакций совершается с применением методов фишинга и
социальной инженерии, которые активно эволюционируют в условиях развития интернета.
По данным исследования компании BI.ZONE [1], мошенничество в интернете остается одним из наиболее значимых вызовов для защиты в цифровом пространстве. За последний год число фишинговых ресурсов выросло на
86%, причем злоумышленники чаще всего создают поддельные сайты, имитирующие популярные онлайн-площадки.
Этот негативный тренд требует непрерывного совершенствования текущих и разработки новых методов выявления аномалий и подозрительных
паттернов поведения участников сети. В связи с этим исследование методов
обнаружения мошеннической активности становится не только актуальным,
но и стратегически важным для обеспечения цифровой безопасности.
Выбор нейронных сетей обусловлен их уникальной способностью адаптироваться к сложным и динамичным структурам данных. Это делает их эффективным инструментом анализа в условиях постоянно меняющихся природы и характера цифрового мошенничества. Применение таких подходов
уже оказывает существенное влияние на различные сферы, включая, но не
ограничиваясь:
• Электронная коммерция: улучшение алгоритмов обнаружения мошенничества в банковских операциях и онлайн-торговле, ускорение выявления махинаций с платежами.
4• Кибербезопасность: разработка инновационных методов выявления аномалий в сетевом трафике и предотвращение цифровой преступности с
акцентом на оперативное реагирование на новые сценарии атак.
• Онлайн-медиа: использование нейронных сетей для нахождения ложных новостей и манипуляций с открытыми источниками данных, повышение их достоверности.
Данная работа посвящена теме определения мошеннических отзывов
на сайтах-агрегаторах рецензий на товары и услуги, таких как Amazon и Yelp.
Применяя решения, исследованные ниже, можно обезопасить клиентов от
ошибочных покупок и укрепить доверие к платформам, что имеет важное
значение для повышения общей безопасности в цифровом пространстве и
защиты прав потребителей.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В данной работе были изучены и проанализированы актуальные подходы к определению мошеннических отзывов и самих недоброжелателей на
крупнейших сайтах-агрегаторах Amazon и Yelp соответственно. Была сформулирована математическая постановка задачи, описаны главные метрики
качества и воспроизведены результаты нескольких наилучших моделей на
языке программирования Python. На основе проделанной работы можно сделать следующие выводы:
• Модель GAGA, разделяющая соседей вершины по их классам перед
агрегацией, показала наилучшие метрики качества в обеих задачах при
доступности открытого исходного кода.
• Архитектура NGS, также работающая с гетерогенными графами, продемонстрировала схожие с GAGA результаты, хотя их воспроизведение
оказалось невозможным.
• Базовый подход агрегации (пространственная парадигма), представленный в GraphSAGE, показал значительное преимущество в качестве на
рассматриваемых задачах по сравнению с модулями GAT и GCN.
Для дальнейшего улучшения результатов в данной области можно рассмотреть следующие направления:
1. Оптимизация моделей: Все исследуемые выше работы предъявляют
значительные требования к ресурсам системы, на которой они запускаются. Можно изучить зависимость итогового качества от выбранных
параметров обучения, чтобы добиться тех же результатов при меньших
ресурсных затратах.
2. Совмещение подходов: К рассматриваемой графовой структуре можно добавить методы обработки естественного языка для извлечения
дополнительных признаков из текстов рецензий.
293. Масштабирование архитектур: Улучшение основных модулей, как,
например, это делают авторы Exphormer [16], может способствовать
достижению больших масштабов и точности моделей.
Таким образом, результаты данной работы подтверждают перспективность использования графовых нейронных сетей для определения мошенничества и предоставляют базу для дальнейших исследований и разработок в
этой области.
Рассмотренные модели могут быть интегрированы в системы модерации
отзывов крупных платформ, таких как Amazon и Yelp, для автоматического
выявления мошеннических рецензий и самих недоброжелателей.


[1] Компания BI.ZONE (2023). «Число мошеннических сайтов в 2023 году выросло на 86%». URL: https://bi.zone/news/ chislo-moshennicheskikh-saytov-v-2023-godu-vyroslo-na-86/.
[2] Центральный банк России (2024). «Обзор операций, совершенных без согласия клиентов финансовых организаций». URL: https://www.cbr. ru/analytics/ib/operations_survey/2023/.
[3] Cheng D., Ye Y., Xiang S., Ma Z., Zhang Y., Jiang, C. (2023). «Anti-Money Laundering by Group-Aware Deep Graph Learning». IEEE Transactions on Knowledge and Data Engineering.
[4] Ding Z., Shi J., Li Q., Cao J. (2023). «Effective Multi-Graph Neural Networks for Illicit Account Detection on Cryptocurrency Transaction Networks». arXiv preprint, 2309.02460.
[5] Dou, Y., Liu, Z., Sun, L., Deng, Y., Peng, H., Yu, P. S. (2020). «Enhancing Graph Neural Network-based Fraud Detectors against Camouflaged Fraudsters». Proceedings of the 29th ACM international conference on information & knowledge management, 315-324.
[6] Hamilton W., Ying Z., Leskovec J. (2017). «Inductive Representation Learning on Large Graphs». Advances in neural information processing systems, 30.
[7] Hu S., Zhang Z., Luo B., Lu S., He B., Liu L. (2023). «BERT4ETH: A Pre¬trained Transformer for Ethereum Fraud Detection». Proceedings of the ACM Web Conference 2023, 2189-2197.
[8] Jesus S., Pombal J., Alves D., Cruz A., Saleiro P., Ribeiro R. P., Gama J., Bizarro P. (2022). «Turning the Tables: Biased, Imbalanced, Dynamic Tabular Datasets for ML Evaluation». Advances in Neural Information Processing Systems, 35, 33563-33575.
[9] Kim H., Choi J., Whang J. J. (2023) «Dynamic Relation-Attentive Graph Neural Networks for Fraud Detection». 2023 IEEE International Conference on Data Mining Workshops (ICDMW), 1092-1096.
[10] Kipf T. N., Welling M. (2017). «Semi-Supervised Classification with Graph Convolutional Networks». International Conference on Learning Representations.
[11] Li S., Qiao B., Li K., Lu Q., Lin M., Zhou W. (2023). «Multi-modal Social Bot Detection: Learning Homophilic and Heterophilic Connections Adaptively». Proceedings of the 31st ACM International Conference on Multimedia, 3908¬3916.
[12] Pan J., Wong S. L., Yuan Y. (2023). «RAGLog: Log Anomaly Detection using Retrieval Augmented Generation». arXiv preprint, 2311.05261.
[13] Pozzolo D. A., Caelen O., Johnson R. A., Bontempi G. (2015). «Calibrating Probability with Undersampling for Unbalanced Classification». 2015 IEEE symposium series on computational intelligence, 159-166.
[14] Qin, Z., Liu, Y., He, Q., Ao, X. (2022). «Explainable Graph-based Fraud Detection via Neural Meta-graph Search». ACM ’22 International Conference on Information & Knowledge Management, 4414-4418.
[15] Rampasek L., Galkin M., Dwivedi V. P., Luu A. T., Wolf G., Beaini D. (2022). «Recipe for a General, Powerful, Scalable Graph Transformer». Advances in Neural Information Processing Systems, 35, 14501-14515.
[16] Shirzad H., Velingker A., Venkatachalam B., Sutherland D. J., Sinop A. K. (2023). «Exphormer: Sparse Transformers for Graphs». International Conference on Machine Learning, 31613-31632.
[17] Sotiropoulos K., Zhao L., Liang P. J., Akoglu L. (2023). «ADAMM: Anomaly Detection of Attributed Multi-graphs with Metadata: A Unified Neural Network Approach». 2023 IEEE International Conference on Big Data (BigData), 865-874.
[18] Tian, S., Dong, J., Li, J., Zhao, W., Xu, X., Song, B., Meng, C., Zhang, T. and Chen, L (2023). «SAD: Semi-Supervised Anomaly Detection on Dynamic Graphs». arXiv preprint, 2305.13573.
[19] Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser L., Polosukhin I. (2017). «Attention Is All You Need». Advances in neural information processing systems, 30.
[20] Velickovic P., Cucurull G., Casanova A., Romero A., Lio P., Bengio Y. (2017). «Graph Attention Networks». International Conference on Learning Representations, 1050, 20, 10-48550.
[21] Wang Y., Zhang J., Huang Z., Li W., Feng S., Ma Z., Sun Y., Yu D., Dong F., Jin J., Wang B., Luo J. (2023). «Label Information Enhanced Fraud Detection against Low Homophily in Graphs». Proceedings of the ACM Web Conference 2023, 406-416.
[22] Xiang S., Zhu M., Cheng D., Li E., Zhao R., Ouyang Y., Chen L., Zheng Y. (2023). «Semi-supervised Credit Card Fraud Detection via Attribute-Driven Graph Representation». Proceedings of the AAAI Conference on Artificial Intelligence, 37, 12, 14557-14565.
[23] Yin S., Zhu P., Wu L., Gao C., Wang Z. (2024). «GAMC: An Unsupervised Method for Fake News Detection Using Graph Autoencoder with Masking». Proceedings of the AAAI Conference on Artificial Intelligence, 38,1,347-355.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ