ВВЕДЕНИЕ 3
1. ТЕХНОЛОГИЯ РАЗРАБОТКИ BI РЕШЕНИЙ 6
1.1. Назначение BI систем 6
1.2. Общие сведения 8
1.3.1. Структурирование данных 12
1.3.2. Обработка данных 13
1.3.3. Пересылка данных 13
1.3.4. Импорт данных в СУБД 14
1.3.5. Обработка ошибок в стадии IDC 14
1.4. Хранение данных 15
1.5. Анализ данных 18
1.6. Доступ к данным и обработка запросов 19
1.7. OLAP-технология 20
2. ОБЗОР СУЩЕСТВУЮЩИХ BI СИСТЕМ 28
2.1. Sap Hana 28
2.2. Microsoft Analytics Platform System 28
2.3. Oracle Big Data Appliance 29
2.4. Tableau 29
2.5. Palantir 29
2.6. QlikView 29
2.7. Jaspersoft Business Intelligence Suite 30
2.8. Prognoz Platform 30
3. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ ФУНКЦИОНАЛА И ИНТЕРФЕЙСА
СИСТЕМЫ «ETTON-BI» 31
3.1. Концепция проекта 31
3.2. Инструменты 33
3.2.1. Redis 33
3.2.2. MongoDB 34
3.2.3. Celery 34
3.2.4. PostgreSQL 34
3.3. Подключение к источнику данных 35
3.4. Загрузка данных в базу данных MongoDB 37
3.4.1. Первичная загрузка данных 37
3.4.2. Дозагрузка данных 38
3.5. Загрузка данных в PostgreSQL 39
3.6. Создание многомерного куба. OLAP Server 43
3.7. Анализ данных, визуализация 45
3.8. Интерфейсы 45
3.8.1. Раздел пользователи 48
3.8.2. Источники данных 48
3.8.3. Список кубов 49
3.8.4. Страница виджетов 49
3.8.5. Магазин 51
ЗАКЛЮЧЕНИЕ 53
СПИСОК ИСПОЛЬЗУЕМЫХ ТЕРМИНОВ И ОПРЕДЕЛЕНИЙ 54
СПИСОК ОБЩЕПРИНЯТЫХ СОКРАЩЕНИЙ 56
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ 57
ПРИЛОЖЕНИЕ
В дипломной работе «Разработка системы бизнес-аналитики» раскрыты принципы работ программных продуктов для обработки и анализа «больших данных», описаны цели и концепции применения.
В настоящее время наблюдается усиленный рост информации, как в мире, так и в любой компании. Для того, чтобы быть лидером в своей сфере, необходимо уметь хранить, обрабатывать и анализировать большие объемы данных. Исходя из этого тот, кто сможет быстрее и качественнее хранить и обрабатывать информацию за длительные промежутки времени - получает преимущество перед своими конкурентами.
BI - это совокупность технологий, программного обеспечения и практик, направленных на достижение целей бизнеса путем наилучшего использования имеющихся данных. Интерактивные визуальные инструменты позволяют ощутить эффект от свободного анализа больших данных, получив точные прогнозы и оптимизированные бизнес-процессы, предсказывающие показатели, вместо констатирующих. Интеллектуальные решения позволяют выявить тенденции и построить прогноз развития событий, или провести многофакторный анализ и смоделировать различные ситуации, что помогает принять верное управленческое решение. Именно поэтому, в отличие от других классов делового программного обеспечения, актуальность во внедрении BI-систем в трудные с экономической точки зрения времена не ослабевает, а только усиливается.
Основными преимуществами внедрения BI системы на текущий момент являются повышение скорости и точности составления отчетов, анализа и планирования, повышение эффективности процессов принятия решений, увеличение удовлетворенности клиентов.
Согласно анализа российского рынка BI решений лидерами являются: SAP, Oracle, Microsoft, IBM и SAS и «Прогноз». Причем «Прогноз» - единственная российская компания на российском рынке бизнес-аналитики, продажи которой оказались сравнимы с ведущими мировыми поставщиками по объему. В условиях импортозамещения актуальность внедрения отечественных BI решений только увеличивается.
Основной целью работы является разработка инновационной системы бизнес-аналитики «Etton-BI». Система представляет собой симбиоз аналитической платформы и серверного оборудования. Акцент сделан на интеграцию с российским оборудованием, но с учетом возможности работы и на оборудовании иностранного производства. В качестве отличительного достоинства системы можно также отметить специализацию ее под бизнес-процессы конкретного предприятия, что делает ее более гибкой, понятной и эффективной.
В рамках данной работы решаются следующие задачи:
1) Определение перечня решаемых задач и выявление областей применения BI систем;
2) Изучение структуры существующих учетных систем и хранящихся в них данных, необходимых для анализа бизнес-процессов. Эти системы будут служить источниками данных для разрабатываемой информационно-аналитической системы;
3) Изучение принципов построения систем анализа данных на основе OLAP- технологий, их архитектуры. Изучение подходов к сегментированию исходных данных, выделением из исходных данных одного или нескольких многомерных наборов данных, оси которых содержат атрибуты, а ячейки - агрегируемые количественные данные. Благодаря такой модели данных пользователи могут формулировать сложные запросы, генерировать отчеты, получать подмножества данных;
4) Изучение ETL процессов, осуществляющих перенос данных внешних источников в хранилище данных систем бизнес-аналитики;
5) Разработка структуры хранилища, наиболее адекватной требованиям компании к аналитическим запросам, а также реализация процесса, включающего в себя извлечение данных из существующих источников, их трансформацию для
5 максимального соответствия нуждам бизнес-модели, и загрузку их в хранилище данных;
6) Проработка современного интерфейса и функционала аналитической работы.
В рамках данной работы были решены следующие задачи:
1) Выявлен круг решаемых задач и область применения BI систем;
2) Проанализированы структуры существующих учетных систем компании и хранящиеся в них данные, необходимые для анализа бизнес-процессов;
3) Изучены принципы построения систем анализа данных на основе OLAP-технологий, их архитектура, подходы сегментирования исходных данных, выделением из исходных данных одного или нескольких многомерных наборов данных (нередко называемый гиперкубом или метакубом), оси которых содержат атрибуты, а ячейки - агрегируемые количественные данные;
4) Изучены ETL процессы, осуществляющие перенос данных внешних источников в хранилище данных систем бизнес-аналитики;
5) Разработана структура хранилища, а также реализован процесс, включающий в себя извлечение данных из существующих источников, их трансформацию, с целью максимального соответствия нуждам бизнес-модели, и загрузка их в хранилище данных;
6) Разработан современный интерфейс в сочетании с набором функционала с широкими возможностями аналитической работы.
Кроме реализованных механизмов были начаты работы по разработке аналитических инструментов и готовых сценариев анализа и обработки данных, которые позволят пользователю в несколько действий получить необходимую ему информацию для оценки эффективности работы предприятия, анализа и прогноза деятельности предприятия, а также помощи в принятии управленческих решений.
1. Андреев А.Н. Классификация OLAP-систем вида xOLAP // Рязанский государственный радиотехнический университет
2. Гамма Э., Хэлм Р., Дженсон Р., Влиссидес Дж. Приемы объектно-ориентированного проектирования. Паттерны проектирования. - СПб: Питер, 2006. - 366 с.
3. Кудрявцев Ю.А. OLAP технологии: обзор решаемых задач и исследований // Бизнес-информатика. - 2008. №1. - С. 66-70.
4. Лисянский К. - “ Архитектурные решения и моделирование данных для хранилищ и витрин данных”. - Статья.
5. Романов В.П. -«Комплекс средств адаптации информационных систем поддержки принятия решений в области экономики».-2004- Диссертации РГБ
6. Холод И.С. -«Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных».-2005- Диссертации РГБ
7. Щавелев Л.В. - «Автоматизация проектирования систем оперативной аналитической обработки данных».-1999- Диссертации РГБ
8. Jeffrey Dean and Sanjay Ghemawat. MapReduce: Simplified Data Processing on Large Clusters. Proceedings of the Sixth Symposium on Operating System Design and Implementation, San Francisco, CA, December, 2004
9. Pentaho Mondrian Project [Электронный ресурс]: Сайт - Режим доступа: http://mondrian.pentaho.com, свободный. 6. Wikipedia [Электронный ресурс]: Сайт
- Режим доступа: http://en.wikipedia.org, свободный.
10. OLAP: Русскоязычная Википедия:https://ru.wikipedia.org/wiki? curid=14600