Введение 5
Глава 1. Теоретическая часть 8
1. Визуализация данных 8
1. Общая информация 8
2. Виды визуализации 11
3. Выбор правильного типа графика 12
2. Дашборды (информационные панели) 20
1. Общая информация 20
2. Функции дашбордов 20
3. Datastorytelling 21
1. Общая информация 21
2. Форматы datastorytelling 23
3. Описание и классификация общих методов datastorytelling 25
4. Алгоритм использования методов datastorytelling 27
Вывод 31
Глава 2. Практическая часть 32
1. Суть кейса 32
2. Структура данных 33
1. DistrictInfo 33
2. ProductInfo 34
3. Engagementdata 34
3. Процесс выполнения кейса по алгоритму 35
1. Подготовительный этап 35
2. Анализ данных 37
3. Подведение итогов исследования 60
4. Создание текста для презентации 61
5. Создание визуализации понятной для подачи 64
6. Финальный этап 65
Вывод 65
Заключение 67
Список использованных источников 68
Данная работа представляет из себя прикладной проект, направленный на решение исследовательского кейса «COVID-19 Impact on Digital Learning» для американской компании LearnPlatform, которая позиционирует себя как объединение исследователей, ученых и учителей, пытающихся сделать образование более доступным и равным .Интерес к данному кейсу вызван в первую очередь актуальностью поднятой темы. За последние два года, пандемия COVID-19 кардинально изменила многие социальные процессы нашего общества. Таким образом, по моему мнению, очень важно проводить анализы данных изменений, вызванных коронавирусом, что в итоге позволит создать цельную картину того, как пандемия COVID-19 перестроила социальные институты человечества. Другой немаловажной частью данного кейса является онлайн образование. Как и в случае с коронавирусом, онлайн образование плотно вошло в жизнь современного человека, значительно изменив образовательный процесс. Поэтому, я также считаю необходимым исследовать процесс становления онлайн образования, как основного метода обучения в наше время. Решение данного кейса, частично сделает вклад в исследование данных изменений.
Цель работы заключается в решении конкретного исследовательского кейса от компании LearningPlatform. Данное решение заключается в проведении анализа состояния сектора онлайн образования в США, а также его оценке его изменений, вызванных пандемией COVID-19. Отдельно стоит отметить, что в рамках решения данного кейса, я должен использовать методы визуализации и storytelling, для получения необходимого результата. Это позволит мне продемонстрировать методы данных инструментариев, и, в процессе, добиться необходимого результата в плане решения выбранного мною кейса.
Далее я укажу последовательный список задач, который позволит мне достичь цели ВКР, а именно решить исследовательский кейс «COVID-19 Impact on Digital Learning».
1. Первая задача — это сбор всей необходимой теоретической информации по методам, которые будут задействованы в исследовании. Это позволит избежать ошибок при использовании инструментария, а также сделать процесс исследования более полным и конкретным.
2. Вторая задача заключается в подготовке к проведению исследования. В рамках данного этапа я должен обработать исходную выборку данных, подобрать необходимое программное обеспечение, а также сформулировать план исследования.
3. Третья задача — это проведение непосредственного исследования, в рамках которого я смогу получить ответы на поставленные создателями кейса вопросы.
4. Последняя задача заключается в оформлении итогов исследования, что позволит организовать более качественную подачу результатов кейса заказчикам. На данном этапе мною будут созданы информационные панели, а также сам сторитейллинг.
Кратко опишем суть кейса. Компанию LearnPlatform, интересует исследование сферы онлайн образования в США за 2020 год, в который началась пандемия коронавируса. В рамках проведения исследования, необходимо проанализировать изменения показателей вовлеченности. Дополнительной частью работы, в соответствии с особенностью компании LearnPlatform, является анализ корреляции «социальных» показателей, например наличия социально уязвимых групп, и уже упомянутых ранее показателей вовлеченности в онлайн образование. Ключевой особенностью работы является инструментарий, который я задействую для решения кейса. К данным методам, используемым в работе, относятся преимущественно визуализация данных и datastorytelling. По своей структуре данная работа будет состоять из четырех глав: теоретической и практической, а также введения и заключения.
В первой главе мною будет приведена вся необходимая информация, теоретического характера, которую я задействую в решении кейса. В данной главе я подробно опишу используемый инструментарий, что позволит более эффективно применить его в рамках исследования.
Вторая глава моей работы заключается в проведении непосредственного исследования направленного на решение кейса. Кратко опишу суть исследования. В структуре кейса, его создатели привели четыре ключевых вопроса, на которые хотели бы получить ответы, а также выборку данных. Таким образом кейс будет решен, если после проведения необходимых исследований над выборкой, будут сформулированы четыре вывода по поставленным вопросам. Выполнение данного условия является ключевой задачей при достижении цели работы.
Отдельно, в рамках вступления ВКР, охарактеризуем используемые в работе источники. В целом в используемых источниках можно выделить три основных. Первым и самым главным источником я бы обозначил платформу Kaggle из которой был взят сам кейс и выборка данных. Вторым, немаловажным источником я бы обозначил книгу Коула Нафлика «StorytellingwithData». Из данной книги я взял основные методы сторителлинга и визуализации данных, на которых строил свое исследование. Это означает, что в какой-то мере я строил всю свою работу на данном источнике. Последним источником я обозначу группу интернет статей, которые позволили мне расширить и дополнить взятые из книги Нафлика методы, чтобы получить более точные и ясные результаты. Подробный список использованных источников информации будет приведен в конце работы. Далее еще раз отдельно выделим цель моей ВКР, а также задачи для ее достижения.
Данная работа заключалась в решении исследовательского кейса «COVID-19 Impact on Digital Learning» для американской компании LearnPlatform. В рамках решения кейса, я провел исследование, с использованием методов визуализации данных и datastorytelling. Отмечу, что это был мой первый опыт решения исследовательского кейса и проведения крупного исследования в формате аналитики данных в целом, однако несмотря на это, мне удалось выполнить поставленные в начале работы задачи и, следовательно, достичь цели ВКР.
В рамках данной работы мною была собрана вся необходимая теоретическая информация, которая затем использовалась в процессе выполнения работы. В целом, данная информация давала необходимые знания по методам визуализации, datastorytelling и информационным панелям. Далее мною были кратко проанализированы методы datastorytelling, а также приведен алгоритм, по которому я смог построить всю свою дальнейшую работу. После выполнения данных «подготовительных» этапов, я смог перейти к непосредственной работе с кейсом, в ходе решения которого, также смог выполнить все поставленные задачи. Мною был обработан и подготовлен к анализу большой массив данных из выборки, после чего я смог провести исследование, ответив на все поставленные создателями кейса вопросы. После проведения исследования, я выполнил заключительную задачу моей ВКР, подготовив решение кейса к презентации непосредственному заказчику. Таким образом, в ходе выполнения данных задач, мне удалось достичь цели моей работы, а именно решить указанный в работе аналитический кейс.
Отдельно рассмотрим результаты решения кейса. Мною было проанализирована сфера онлайн образования в США за 2020 год. В ходе проведения исследования я смог изучить ключевые показатели, показывающие вовлеченность студентов в образовательный онлайн процесс. Изучение данных показателей, позволило мне изучить то, как пандемия COVID-19 изменила данный сектор образования, а также сделать приблизительные прогнозы по развитию цифрового обучения. Также, отдельной частью моего исследования можно выделить изучение связи между социальными показателями и степенью «популярности» онлайн обучения в исследуемых округах. Изучение данного вопроса вскрыло многие проблемы, актуальные в американском обществе. Пандемия и введение карантинных мер показали, что США не до конца готовы к преодолению таких катастроф, так как значительная часть населения частично или полностью не могут использовать цифровое обучение, а следовательно, получать образование во время эпидемий или других кризисов.
1. Learn Platform [Электронный ресурс]. Режим доступа: https://learnplatform.com
2. Паклин, Н. Б.Бизнес-аналитика. От данных к знаниям. /Паклин Н. Б., Орешков В. И. — 2-е изд. — СПб.: Питер, 2013. — С. 173—210.
3. Что такое инфографика? Определения и отличия от смежных понятий.[Электронный ресурс]. Режим доступа: https://vizual.club/2017/10/31/chto-takoe-infografika-opredelenye/
4. Особенности восприятия визуальной информации. [Электронный ресурс]. Режим доступа: https://studopedia.ru/24_42110_osobennosti-vospriyatiya-vizualnoy-informatsii.html
5. Каналы восприятия: визуал, аудиал, кинестет, дигитал. [Электронный ресурс]. Режим доступа: https://hr-portal.ru/article/kanaly-vospriyatiya-vizual-audial-kinestet-digital
6. Визуализация данных: что это и зачем используется в 2020 году. [Электронный ресурс]. Режим доступа: https://avertoni.ru/data-visualization/
7. Зачем и как использовать визуализацию данных?[Электронный ресурс]. Режим доступа: https://habr.com/ru/company/developersoft/blog/240325/
8. Как выбрать тип диаграммы для визуализации данных учитывая контекст. [Электронный ресурс]. Режим доступа: https://infogra.ru/infographics/kak-vybrat-tip-diagrammy-dlya-vizualizatsii-dannyh-uchityvaya-kontekst
9. Как визуализировать данные: виды графиков. [Электронный ресурс]. Режим доступа: https://timeweb.com/ru/community/articles/kak-vizualizirovat-dannye-vidy-grafikov
10. График-радарвQlikSense. [Электронный ресурс]. Режим доступа: https://blog.atkcg.ru/grafik-radar-ili-paukoobraznaya-diagramma-v-qlik-sense-kastomiziruem-rasshirenie/
11. Создание диаграммы с картой в Excel.[Электронный ресурс]. Режим доступа: https://support.microsoft.com/ru-ru/office/создание-диаграммы-с-картой-в-excel-f2cfed55-d622-42cd-8ec9-ec8a358b593b
12. Древовидная диаграмма.[Электронный ресурс]. Режим доступа: https://www.kpms.ru/Implement/Qms_Tree_Diagram.htm
13. 11 правил визуализации данных. [Электронный ресурс]. Режим доступа: https://netology.ru/blog/11-pravil-vizualizacii-dannykh
14. Желязны, Д. Говори на языке диаграмм. / Д. Желязны, — 1-е изд. — Институт комплексных стратегических исследований, 2004. — С. 220.
15. The Future of Information Dashboards.[Электронный ресурс]. Режим доступа: https://uxmag.com/articles/the-future-of-information-dashboards
16. Дашборд — что это и почему он будет вам полезен. [Электронный ресурс]. Режим доступа: https://habr.com/ru/company/developersoft/blog/341972/
17. Что такое сторителлинг и как писать в этом жанре. [Электронный ресурс]. Режим доступа: https://text.ru/blog/chto-takoe-storitelling-i-kak-pisat-v-etom-zhanre
18. История сторителлинга: преимущества для брендов. [Электронный ресурс]. Режим доступа: https://adwai.digital/blog/istoriya-storitellinga
19. Knaflik K. Storytelling with data. Data visualization guidefor business professionals. /K. Knaflik — 1-еизд. — Published by John Wiley & Sons, Inc 2015. — С. 284.
20. Что такое аналитический сторителлинг?[Электронный ресурс]. Режим доступа: https://powerbi.microsoft.com/ru-ru/data-storytelling/
21. Лучшие практики для Data Storytelling. [Электронный ресурс]. Режим доступа: https://qliksense.ivan-shamaev.ru/data-storytelling-in-qlik-sense-visualization/
22. Тайкс, Б. Data Storytelling: How to Drive Change with Data, Narrative and Visuals / Б. Тайкс. — 1-еизд. — John Wiley and Sons, Inc., 2019. — С. 235.
23. How to Persuade Your Audience with Data Storytelling [Электронный ресурс]. Режим доступа: https://www.wordstream.com/blog/ws/2021/05/27/data-storytelling
24. LearnPlatform COVID-19 Impact on Digital Learning. [Электронный ресурс]. Режим доступа: https://www.kaggle.com/competitions/learnplatform-covid19-impact-on-digital-learning
25. The History of Race, Class, and Real Estate. [Электронный ресурс]. Режим доступа: https://datasmart.ash.harvard.edu/news/article/map-of-the-month-redlining-louisville-1062