ВВЕДЕНИЕ 3
1 ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА
ДАННЫХ 6
1.1 ОБЩЕЕ ПОНЯТИЕ ДАННЫХ (BIG DATA) 6
1.2 ОПРЕДЕЛЕНИЕ DATA MINING И ЕГО ЗАДАЧ 9
1.3 БАНКОВСКАЯ ДЕЯТЕЛЬНОСТЬ И ОПЕРАЦИИ СО СЧЕТАМИ ... 15
2 АНАЛИЗ ДАННЫХ ПО ОБСЛУЖИВАНИЮ КОРПОРАТИВНЫХ
КЛИЕНТОВ БАНКА 22
2.1 ПОЛНАЯ МОДЕЛЬ ДЕЯТЕЛЬНОСТИ УПРАВЛЕНИЯ
ОРГАНИЗАЦИИ ПРОДАЖ РЕГИОНАЛЬНОГО ГОССЕКТОРА (РГС) УРАЛЬСКОГО БАНКА ПАО СБЕРБАНК 22
2.2 АНАЛИЗ ЭФФЕКТИВНОСТИ ФУНКЦИОНИРОВАНИЯ
ОТДЕЛЕНИЙ БАНКА С ИСПОЛЬЗОВАНИЕМ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ 39
2.3 ОПИСАНИЕ ИСХОДНЫХ ДАННЫХ ДЛЯ АНАЛИТИКИ 43
2.4 ПРИМЕНЕНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА
ДАННЫХ ПРИ НАХОЖДЕНИИ РЕШЕНИЙ ЗАДАЧИ 45
3 РАСЧЕТ ФИНАНСОВЫХ ПОКАЗАТЕЛЕЙ ОЦЕНКИ
ЭКОНОМИЧЕСКОЙ ЭФФЕКТИВНОСТИ 54
3.1 ИСХОДНЫЕ ДАННЫЕ 54
3.2 АНАЛИТИКА ДАННЫХ 56
3.3 ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ ПРОЕКТА 67
ЗАКЛЮЧЕНИЕ 86
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 88
Объемы накопленных данных в настоящее время настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в этих "сырых данных" заключены знания, которые могут быть использованы при принятии решений. Для того чтобы провести автоматический анализ данных, используется Data Mining.
Интеллектуальный анализ данных с каждым годом становится все более актуальным направлением изучения во всех сферах жизни людей: банковский, страховой, государственный сектора и другие.
Интенсивное применение интеллектуального анализа данных (ИАД) осуществляется благодаря наличию рабочих инструментов, реализующих разнообразные методы ИАД. По мнению некоторых экспертов, в ближайшее десятилетие интеллектуальный анализ данных и его ядро - Data Mining - станут наиболее перспективными направлениями разработки программного обеспечения. По заявлению издания MIT Technology Review, Data Mining - одна из десяти развивающихся технологий, которые «изменят мир».
Современные технологии Data Mining перерабатывают информацию с целью автоматического поиска шаблонов (паттернов), характерных для каких- либо фрагментов неоднородных многомерных данных. В отличие от оперативной аналитической обработки данных (online analytical processing, OLAP) в Data Mining бремя формулировки гипотез и выявления необычных шаблонов переложено с человека на компьютер.
Интеллектуальный анализ данных (ИАД) обычно определяют, как метод поддержки принятия решений, основанный на анализе зависимостей между данными. В рамках такой общей формулировки обычный анализ отчетов, построенных по базе данных, также может рассматриваться как разновидность ИАД.
Целью данной магистерской диссертации является исследование большого объема данных базы корпоративных клиентов банка при помощи методов интеллектуального анализа данных.
В соответствии с поставленной целью в работе будут решены следующие задачи:
• изучить теоретические основы интеллектуального анализа данных;
• рассмотреть существующие методы интеллектуального анализа;
• изучить имеющуюся базу корпоративных клиентов;
• применить методы ИАД для анализа клиентской базы;
• сделать выводы по эффективности применения методов ИАД;
• провести анализ оттоков ФОТ по клиентам, используя методы интеллектуального анализа данных;
• провести расчет финансовых показателей оценки экономической эффективности;
• сделать выводы об экономической эффективности удержания оттоков по клиентам.
Объектом исследования данной работы является процесс интеллектуального анализа больших объемов данных базы корпоративных клиентов банка, а предметом - методы, алгоритмы и технологии интеллектуального анализа больших объемов данных.
В данной работе рассматриваются возможности и перспективы использования интеллектуального анализа данных для больших объемов данных. Кроме этого, раскрывается специфика ИАД, его технологии, выявляются типы знания, которые могут быть получены с помощью интеллектуального анализа данных. С каждым годом объем накопленных данных увеличивается, а количество важной и значимой информации сокращается, это обусловливает непрерывный поиск возможностей эффективного извлечения полезной информации из огромного объема получаемых данных.
В качестве методов исследования, в данной работе будут изучены и применены методы интеллектуального анализа данных для больших объемов данных. Будет произведено сравнение методов и выявлено наиболее подходящие для данной работы методы, которые бы позволили наиболее полно и точно проанализировать такой большой объем данных, как клиентская база.
Диссертационная работа состоит из трех частей:
1. Теоретический материал по темам: Big Data, интеллектуальный анализ данных, Data Mining;
2. Анализ больших данных по обслуживанию корпоративных клиентов банка на примере ПАО Сбербанк;
3. Расчет финансовых показателей оценки экономической эффективности.
В ходе выполнения работы были изучены методы интеллектуального анализа данных точки зрения возможности применения каждого для анализа данных в данной работе. По результатам, было выбрано два метода: классификация и прогнозирование. Так как имеющаяся база корпоративных клиентов обладает достаточно большим объемом данных, которые нет возможности обработать вручную, именно поэтому и были применены методы интеллектуального анализа данных.
В практической части работы была построена полная модель отдела организации продаж регионального госсектора (РГС) Уральского банка ПАО Сбербанк, в которой описаны цели и задачи отдела, и основные бизнес - процессы отдела. Кроме этого был произведен анализ эффективности функционирования отделений Сбербанка по Свердловской области на предмет необходимости сокращения количества отделений в регионе с целью оптимизации деятельности. Анализ также производился с использованием методов интеллектуального анализа данных. Также была проанализирована клиентская база корпоративных клиентов, которая представляет собой огромную базу данных в формате MS Excel, состоящая из 5800 строк и 63 столбцов, заполненных данными. База состоит из клиентов Свердловской области, принадлежащих государственному сектору, например, администрации муниципальных образований, университеты, больницы, школы, детские сады, аптеки, силовые структуры и другие. По каждому клиенту известна численность сотрудников, местонахождение, вид деятельности, организационно-правовая форма, форма собственности, а также известен размер чистых активов, выручки и чистой прибыли за 2017 год.
Кроме того, была произведена оценка экономической эффективности финансовых показателей на примере оттоков объемов ФОТ по клиентам Сбербанка. По результатам которой было выявлено, что проект эффективен.
В результате изучения и практического применения методов интеллектуального анализа данных можно сделать вывод, что данные методы подходят для аналитики больших объемов данных
1. Поручиков М.А. Анализ данных: учебное пособие - Самара: Изд- во Самарского университета, 2016. - 88 с.
2. Копытова А.И. Банки и банковское дело: учебное пособие - Томск: Изд-во ТГПУ, 2009. - 248с.
3. Тавасиев, А. М. Банковское дело: учебник для бакалавров — Москва: Издательство Юрайт, 2016. — 647 с.
4. Лаврушин О.И. Валенцева Н.И. Банковское дело: учебник - М.:КНОРУС, 2016. - 800с.
5. Курс: Анализ данных [Электронный ресурс]: [б.и.], 2013, - Электрон. текстовые дан. on-line.
6. Чернышова Г.Ю. Интеллектуальный анализ данных: учеб. пособие для студентов специальности 080801.65 «Прикладная информатика (в экономике)» - Саратовский государственный социально-экономический университет. - Саратов, 2012. - 92 с.
7. Афанасьева С.В. Технология интеллектуального анализа данных: учеб. пособие - М.:Нац. исслед. ун-т «Высшая школа экономики», 2013. - 152 с.
8. Мосягин А.Б.. Использование методологии Data Mining при решении задач обработки социальных данных. Статья, журнал «Мониторинг общественного мнения» 2 (126), март-апрель 2015 г.
9. Маслова Н.А. О применении интеллектуального анализа данных для защиты информации корпоративных систем. Статья, журнал «Искусственный интеллект» 4, 2009 г.
10. Чубукова И.А. Data Mining - ознакомительный курс.
11. Андреев, И.М. Описание алгоритма CART / И.М.Андреев // Exponenta Pro. Математика в приложениях. 2004. - № 3-4. - С.48-53. [Статья].
12. Роднин А.В., Турчик В.Ю. Концепция применения интеллектуального анализа данных в средствах защиты информации базы данных. [Статья].
13. Горбань А.Н. Обучение нейронных сетей. М.: СССР-США СП «Параграф», 1990. 160с.
14. Левитин А.В. Алгоритмы. Введение в разработку и анализ. М.: Вильямс, 2006. 576с.
15. Аскинадзи В.М. Инвестиции: учебник для бакалавров / В.М. Аскинадзи, В.Ф. В.Ф. Максимова. - М.: Юрайт. - 2014. - 422...