Введение 4
1 Обзор средств для анализа госзакупок 5
1.1 Система государственных закупок 5
1.2 Нарушения в государственных закупках 12
1.3 Обзор аналогов 15
1.4 Технологии, используемые при анализе данных 17
1.5 Задание на разработку 18
2 Проектирование средств для анализа госзакупок 20
2.1 Выбор технологий 20
2.2 Архитектура системы 22
2.3 Проектирование базы данных 23
2.4 Проектирование парсера 25
2.5 Проектирование OLAP куба 26
3 Разработка средств для анализа госзакупок 28
3.1 Реализация ETL-процессов 28
3.2 Формирование структуры OLAP куба 30
4 Результаты анализа госзакупок 32
4.1 Инструмент эксперта аналитика 32
4.2 Примеры результатов анализа 38
4.3 Нарушения 50
4.3.1 Нарушения со сроками 50
4.3.2 Анализ применения латиницы в русских словах
Заключение
Список публикаций 55
Список используемых источников 56
Приложение А 59
Приложение Б 68
Приложение В 69
Приложение Г 72
Использование современных технологий в области организации финансовых отношений между компаниями повлекло к созданию портала государственных закупок Российской Федерации. С 1 января 2011 года портал предоставляет сервисы для поиска информации, размещения заказов на поставки товаров, размещения предложений выполнения работ, оказание услуг для государственных и муниципальных нужд.
В связи с большим объёмом размещаемой информации, а также с несовершенством технических возможностей ресурса, не редко имеют место случаи нарушений среди участников конкурсов.
Целью данной работы является разработка набор инструментов анализа данных государственных закупок, помогающих аналитикам в нахождении нарушений, а также в формировании статистики.
Объектом исследования является анализ портала госзакупок. Инструментами для проведения анализа являются средства технологий On-Line Analytical Processing (OLAP), позволяющие представить информацию в виде, удобном для анализа и находить ранее скрытые знания, например, зависимости между изменениями данных, ранее не рассматриваемых при других видах анализа.
Предметом исследований, представленных в данной работе, является автоматизация процесса сбора и анализа данных портала государственных закупок (сокращенно госзакупки) и предоставление возможности быстрого и гибкого анализа полученных данных. Поскольку объём данных по Российской Федерации слишком большой (около 300Гб), для первичного анализа было решено выбрать одну из областей Российской Федерации. Поскольку работа выполнялась в Томской области, информация о сделках, проводимых в данной области, представляет наибольший интерес.
В ходе данной работы были выполнены следующие задачи:
• собрана и проанализирована научно-техническая информация по тематике исследования;
• разработана информационная модель данных о государственных закупках;
• проанализированы типовые мошеннические схемы;
• проведен анализ существующих решений;
• разработана архитектура информационно-аналитической системы;
• реализована база данных;
• построены витрины данных для проведения многомерного анализа;
• спроектированы и реализованы ETL процессы;
• проведён анализ полученных данных
• найдены мошенники на основе анализа применения латиницы
Во время работы над магистерской диссертацией были написаны статьи «Использование технологий Business Intelligence для анализа данных в сфере государственных закупок», которая была размещена в материалах международной научно-практической конференции «Технологии Microsoft в теории и практике программирования» весной 2015 года и «Извлечение и анализ данных с портала государственных закупок», которая была размещена в материалах международной научно-практической конференции «Молодежь и современные информационные технологии».
Проведено комплексное описание и анализ финансово-экономических аспектов выполненной работы. Рассмотрены вопросы выполнения требований к безопасности и гигиене труда, к промышленной безопасности, охране окружающей среды и ресурсосбережения.