1. Анализ и определение основных элементов системы визуализации
статистических данных 8
1.1. Анализ существующих пакетов прикладных программ статистической
обработки данных 8
1.2. Обзор методов статистического прогнозирования 15
1.3. Изучение технологий для реализации системы визуализации 20
2. Формирование концептуальной модели для визуализации данных 29
2.1. Выделение функций реализации 29
2.2. Выбор и обоснование математического аппарата 31
2.3. Обработка исходных данных, построение таблиц в СУБД 34
2.4. Разработка интерфейса пользователя 37
3. Анализ статистических данных УВД АК за 2020 ГОД 42
3.1. Примеры работы системы для анализа отделов УВД 42
3.2. Работа системы в режиме прогнозирования 47
3.3. Анализ результатов работы системы визуализации 51
Заключение 54
Библиографический список 56
Приложение А 59
РЕФЕРАТ
Тема выпускной работы: «Разработка информационной системы визуализации статистических данных по работе УВД АК».
Цель работы - построение и реализация информационной системы инфографики для отображения статистики УВД по районам Алтайского края.
Предмет исследования - система инфографики для визуального представления статистических показателей работы УВД АК.
Объект исследования - процессы анализа, прогнозирования и представления статистической информации.
В результате исследования решены следующие задачи: выполнен сравнительный анализ существующих систем с подобными возможностями с целью формирования требований к будущей системе; проведен сравнительный анализ статистических методов прогнозирования с целью определения оптимального (оптимальных) для данного исследования; определен язык представления данных, СУБД для хранения предоставленных ресурсов; выбран язык и среда для реализации интерфейса к СУБД; выделены основные функции для будущей системы визуализации данных, проанализированы предоставленные статистические данные с целью выделения основных сущностей, связей, с последующим построением схемы данных; разработана и реализована информационная система.
Объем работы 61 страница, количество рисунков - 16, таблиц - 9, приложений - 1, 21 использованный источник литературы.
Ключевые слова: визуализация данных, статистическое
прогнозирование, статистический анализ, графическое представление, картограмма, диаграмма, автоматизация.
Самым важным этапом любого научного исследования является статистический анализ данных. В течение многих десятилетий только специалисты, имеющие большой опыт и серьезную предварительную подготовку, могли работать над анализом данных. В настоящее время статистическая обработка данных поднялась на новый уровень. Благодаря непрекращающейся разработке пакетов прикладных программ, исследователь уже может и не иметь математической профессиональной подготовки, ему достаточно грамотно оперировать статистическими понятиями и выбирать верный метод анализа данных [8, 10].
Представление материалов с использованием методов визуализации данных является одним из основополагающих платформ для качественного восприятия и понимания информации. Именно подобные технологии с каждым годом приобретают все большую актуальность для анализа, обработки и интерпретации информации. Использование графических изображений делает процесс изучения объектов и явлений более наглядным. Методы визуализации данных помогают улучшить понимание и восприятие нового изучаемого материала, а также обеспечить минимизацию усилий по выполнению когнитивных задач в сравнении с текстовым представлением данных. При этом графическое представление информации позволяет произвести анализ данных в эстетичном и удобочитаемом формате.
На сегодняшний день рынок коммерческих статистических продуктов предлагает большой выбор пакетов с самыми разными возможностями и функциями. Все пакеты прикладных программ, реализующие обработку статистических данных, можно разделить на профессиональные, популярные и специализированные. Профессиональные пакеты имеют широкий выбор методов анализа данных. Популярные или полупрофессиональные пакеты прикладных программ универсальны в своем применении, предоставляя возможность использования большого количества функций. Специализированные программы ориентированы на узкую область применения.
Актуальность темы исследования обусловлена высокой ценой и технической сложностью существующих прикладных программ построения инфографики. Подобные программы чаще всего относятся к ресурсоёмкому и наукоемкому программному обеспечению, которое требует длительной настройки под конкретную предметную область. Разрабатываемая информационная система предоставляет необходимый набор возможностей обработки и представления статистических данных, а интуитивный интерфейс быстрое и эффективное внедрение в рабочий процесс.
Цель выпускной квалификационной работы - построение и реализация информационной системы инфографики для отображения статистики УВД по районам Алтайского края.
Задачи исследования:
1. Выполнить сравнительный анализ существующих систем с подобными возможностями с целью формирования требований к будущей системе.
2. Провести сравнительный анализ статистических методов
прогнозирования с целью определения оптимального (оптимальных) для данного исследования.
3. Определить язык представления данных, СУБД для хранения предоставленных ресурсов, языка и среды для реализации интерфейса.
4. Выделить основные функции системы визуализации.
5. Проанализировать и обработать предоставленные данные, выделить сущности, связи и построить схему данных.
6. Разработать и реализовать информационную систему.
Объектом исследования являются процессы анализа,
прогнозирования и представления статистической информации.
Предмет исследования - система инфографики для визуального представления статистических показателей работы УВД АК.
Практическая значимость работы состоит в том, разработанная система позволяет разрешить ряд проблем, связанных с представлением и анализом численных показателей работы отделов УВД Алтайского края. Возможности визуализации данных способствуют повышению скорости и эффективности как первичной, так и углубленной обработки информации. А встроенные методы прогнозирования предоставляют возможность делать выводы не только основываясь на реальных, но уже прошедших результатах, но и на математически обоснованных прогнозах показателей раскрываемости отделов.
Научная новизна заключается в разработке метода визуализации путём внедрения комплексной обработки данных методами ранжирования и статистического прогнозирования.
В данной работе мы рассмотрели некоторые языки программирования с поддержкой графических библиотек, среды разработки, а также средства управления базами данных. Для реализации системы визуализации был выбран языки C#, Python и среда разработки Visual Studio.
Используя метод семантического моделирования были выделены основные структуры данных, построена модель, состоящая из шести сущностей: «Преступления», «Отделы», «Районы», «Преступления в
отделах», «Преступления в районах», «Года».
Для системы была построена база данных, содержащая статистическую информацию по работе УВД АК за 12лет и реализованная в российской СУБД PostgreSQL 10.0. База удовлетворяет требованиям третьей нормальной формы. Импорт данных происходил с помощью разработанного модуля для автоматического переноса данных в СУБД.
Анализ выявил необходимый набор функций для системы визуализации: построение точечных картограмм и диаграмм, просмотр статистической информации по работе отделов, вывод результатов анализа данных методами математической статистики, внедрение методов статистического прогнозирования.
Для реализации модуля прогнозирования статистических данный были выбраны следующие методы: метод скользящей средней, метод простого экспоненциального сглаживания, метод двойного экспоненциального сглаживания, а также линейная регрессия. С их помощью был построен прогноз результатов работы отделов УВД АК на 2021 календарный год. Полученные данные также добавлены в реализованную базу данных.
С учетом предоставленных требований к продукту была реализована система визуального представления статистической информации по работе отделов УВД Алтайского края. Программный модуль приложения разработан согласно «Клиент-серверной» технологии и позволяет в
многопользовательском режиме получать доступ к актуальной информации.
54
Возможности приложения предполагают работу в четырех режимах. Первый режим - импорт статистических данных, представленных в виде структурированных таблиц формата «.xlsx». Второй режим - графическое представление данных (построение картограмм, гистограмм и круговых диаграмм) с выводом результатов математической статистики. Третий режим - вывод информации по работе отдельных подразделений, имеющей аналитический характер. Четвертый режим - вывод результатов статистического прогнозирования данных.
Разработанная система визуализации была протестирована на статистических данных УВД Алтайского края каждого год последних 12 лет. В течение ряда экспериментальных запросов, все режимы работы предоставляли верные результаты анализа информации, корректное построение графиков.
Электронные ресурсы
1. Бабкин С.В., Конобеевских В.В. Статистические свойства экспертных оценок // Вестник ВИ МВД России. 2008. №3. URL: https://cyberleninka.rU/article/n/statisticheskie-svoystva-ekspertnyh-otsenok (дата обращения: 11.05.2021).
2. Васюткина И.А., Разработка приложений на C# с использованием СУБД PostgreSQL [Электронный ресурс]: учебное пособие / Васюткина И.А., Трошина Г.В., Бычков М.И., Менжулин С.А. - Новосибирск: Изд-во НГТУ, 2015. - 143 с. - ISBN 978-5-7782-2699-9 - Режим доступа: http://www.studmedlib.ru/book/ISBN9785778226999.html (дата обращения: 11.05.2021).
3. Гржибовский А.М., Иванов С.В., Горбатова М.А. Описательная статистика с использованием пакетов статистических программ Statistica и SPSS // Наука и здравоохранение. 2016. №1. URL: https://cyberleninka.ru/article/n/opisatelnaya-statistika-s-ispolzovaniem-paketov- statisticheskih-programm-statistica-i-spss (дата обращения: 11.05.2021).
4. Документация Firebird. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https: //www.firebirdsql. org/manual/ru/ (дата обращения: 11.05.2021).
5. Документация Npgsql. [Электронный ресурс]. Заглавие с экрана. Режим доступа: http://www.npgsql.org/doc/index.html (дата обращения: 11.05.2021).
6. Документация по Visual C++. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https: //docs.micro soft.com/ru-ru/cpp/?view=vs-
2017#pivot=workloads&panel=workloads 1 (дата обращения: 11.05.2021).
7. Документация по Visual Studio. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https://docs.microsoft.com/ru-RU/visualstudio/?view=vs- 2017 (дата обращения: 11.05.2021).
8. Информатизация криминологических исследований/
А.Я. Минин. - Москва: МГПУ, 2015. - 168 стр. ISBN: 978-5-4263-0244-0. [Электронный ресурс]. Режим доступа:
http://www.adhdportal.com/book 768.html (дата обращения: 11.05.2021).
9. Корнев В.М., Баканач О.В., Токарев Ю.А., Данилин Д.С. Трансформация оперативной отчетности компании на основе подхода Business Intelligence // Вестник ВГУИТ. 2016. №4 (70). URL: https://cyberleninka.ru/article/n/transformatsiya-operativnoy-otchetnosti-kompanii- na-osnove-podhoda-business-intelligence (дата обращения: 11.05.2021).
10. Мастицкий С.Э., Шитиков В.К. (2014) Статистический анализ и визуализация данных с помощью R. - Электронная книга, адрес доступа: http://r-analytics.blogspot.com (дата обращения: 11.05.2021).
11. Работа с базами данных на языке C#. Технология ADO .NET: учебное пособие / сост. О. Н. Евсеева, А. Б. Шамшев. -Ульяновск: УлГТУ, 2009. - 170 с. ISBN 978-5-9795-0475-9. [Электронный ресурс]. Режим доступа: https://studfiles.net/preview/1496621/ (дата обращения: 11.05.2021).
12. Руководство по программированию на C#. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https://docs.microsoft.com/ru- ru/dotnet/csharp/programming-guide/ (дата обращения: 11.05.2021).
13. Статистический анализ данных и способы представления результатов исследования: Учебно-методическое пособие к курсам «Экспериментальная психология» и «Психодиагностика» / Е.Г. Заверткина, Н.Г. Рукавишникова. Ярославль: Изд-во ЯГПУ, 2000. 47с. - Режим доступа: http://yspu.org/images/0/05/Рукавишникова Н.Г.,Заверткина Е.Г.Статистич еский анализ данных и способы представления результатов исследования .pdf (дата обращения: 11.05.2021).
14. Труфанова Т.В., Нещеменко К.Д. Способы прогнозирования курса валют на основе моделей экспоненциального сглаживания и Хольта // Вестник Амурского государственного университета. Серия: Естественные и экономические науки. 2019. №87. URL:
https://cyberleninka.ru/article/n/sposoby-prognozirovaniya-kursa-valyut-na- osnove-modeley-eksponentsialnogo-sglazhivaniya-i-holta (дата обращения: 11.05.2021).
15. Чернышова Г.В. Применение средств Business Intelligence для малого и среднего бизнеса // Информационная безопасность регионов. 2013. №2 (13). URL: https://cyberleninka.ru/article/n/primenenie-sredstv-business- intelligence-dlya-malogo-i-srednego-biznesa (дата обращения: 11.05.2021).
16. Шилов А.В. Возможности и недостатки использования
скользящей средней при выработке прогнозных решений [Электронный ресурс]. - Режим доступа: https://studylib.ru/doc/2526390/vozmozhnosti-i-
nedostatki-ispol.zovaniya (дата обращения: 11.05.2021).
17. Eclipse Documentation. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https://www.eclipse.org/documentation/ (дата обращения: 11.05.2021).
18. MonoDevelop Documentation. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https://www.monodevelop.com/documentation/ (дата обращения: 11.05.2021).
19. MySQL Documentation. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https://dev.mysql.com/doc/ (дата обращения: 11.05.2021).
20. PostgreSQL: Документация. [Электронный ресурс]. Заглавие с экрана. Режим доступа: https://postgrespro.ru/docs/postgresql (дата обращения: 11.05.2021).
...