Тип работы:
Предмет:
Язык работы:


Обработка и визуализация научных данных

Работа №39015

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы54
Год сдачи2019
Стоимость6500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
232
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
1. ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ В ОБЛАСТИ ОБРАБОТКИ
И ВИЗУАЛИЗАЦИИ ДАННЫХ 5
1.1 Существующие подходы к обработке данных 5
1.2 Существующие подходы к реализации сред для обработки данных 9
1.3 Существующие подходы к визуализации данных 11
2. ИНСТРУМЕНТЫ 16
3. РЕАЛИЗАЦИЯ ОРГАНИЗАЦИИ ВЫЧИСЛЕНИЙ 22
3.1 Представление структуры вычислений 22
3.2 Представление структуры вычислений на файловой системе 23
3.3 Сценарии обработки данных 27
3.4 Редактор проектов 28
3.5 Пример работы с платформой 30
4. РЕАЛИЗАЦИЯ ВИЗУАЛИЗАЦИИ ДАННЫХ 38
4.1 Визуализация в виде плоских графиков 38
4.2 Визуализация объемных данных 40
5. ЗАКЛЮЧЕНИЕ 43
ГЛОССАРИЙ 45
СПИСОК ЛИТЕРАТУРЫ 46
ПРИЛОЖЕНИЕ 50


Подсчеты компании Cisco говорят о том, что к 2021 г. мировой объем интернет трафика достигнет 278 миллионов терабайт в месяц. Большую часть этих данных важно подвергать обработке, благодаря чему возникает необходимость в реализации систем обработки данных. Современная реализация вычислений разного рода, в том числе и высоконагруженных, в последнее время приводит к активному использованию технологий облачных вычислений. [2] В настоящее время существует ряд решений [3], предназначенных для организации процесса обработки больших данных, но они, в большинстве своем, сконцентрированы на управлении потоками данных, при этом забывая о визуализации полученных результатов обработки.
Учитывая современные объемы данных, большинство пользователей просто не в состоянии зрительно обработать массивы чисел, даже если они представлены в виде сводок. Текущие реализации систем облачной обработки данных представляются сложными и неинформативными, из-за чего используются менее производительные, но более приветливые к пользователю инструменты обработки данных.
Актуальность данной работы заключается в решении проблемы организации обработки и визуализации больших данных. Во-первых, платформа позволит выделять взаимосвязи между полученными результатами используя ациклический граф обработки. Во-вторых, инструмент позволит визуализировать полученные результаты без вывода данных во внешние системы. В-третьих, пользователям будет доступна визуализация полученных данных в различных форматах: двумерном (графики) и трехмерном (3D модели объектов).
Объектом данного исследования является разработка аналитической платформы, предназначенной для обработки и визуализации различных данных.
Предметом данного исследования является аналитическая платформа, предназначенная для обработки и визуализации различных данных.
Целью данной работы является разработка аналитической платформы, предназначенной для организации обработки и визуализации сложной разнородной информации, без привязки к конкретным форматам.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Обзор и анализ существующих решений и инструментов.
2. Определить среду разработки и инструменты.
3. Разработка решения для анализа, управления и обработки информации.
4. Разработка дополнительных модулей визуализации данных.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В работе описан процесс разработки аналитической платформы, предназначенной для обработки и визуализации данных. Результатом данной работы стала разработанная аналитическая платформа, предназначенная для обработки и визуализации данных. Аналитическая платформа позволяет выполнять различные задачи, связанные с обработкой данных. Также в аналитической платформе реализована поддержка визуализации плоских графиков и объемных моделей.
Проблема, поставленная перед автором работы решена реализацией платформы, позволяющей выделять взаимосвязи между полученными результатами используя ациклический граф обработки. Кроме того, инструмент позволяет визуализировать полученные результаты без вывода данных во внешние системы в плоском и объемном виде.
В процессе выполнения данной работы были решены следующие задачи:
1. Произведен обзор и анализ существующих решений и инструментов.
2. Определена среда разработки и инструменты необходимые для разработки и работы аналитической платформы.
3. Было разработано решение для анализа, управления и обработки информации.
4. Была произведена разработка дополнительных модулей визуализации плоских и объемных данных.
Таким образом, цель магистерской работы была достигнута.
Дальнейшее развитие платформы предполагает:
• Создание новых типов узлов
• Создание веб версии платформы
• Использование интернета вещей для увеличения мощности платформы



1. Cisco: облачный трафик к 2021 г. составит 95% совокупного трафика ЦОД [Электронный ресурс]. - Режим доступа: https://www.plusworld.ru/daily/cat-analytics/cisco-oblachnyj-trafik-k-2021- g-sostavit-95-sovokupnogo-trafika-tsod/, свободный.
2. Болодурина И.П. Управление потоками данных в высоконагруженных информационных системах, построенных на базе облачных вычислений / Болодурина И.П., Парфёнов Д.И. // СИСТЕМЫ УПРАВЛЕНИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОЕИИ. - 2015. - 59.-С. 111 - 118.
3. Батаев А. В. Анализ мировых трендов в сфере облачных технологий / Батаев А. В. // ФУНДАМЕНТАЛЬНЫЕ И ПРИКЛАДНЫЕ ИССЛЕДОВАНИЯ В ОБЛАСТИ УПРАВЛЕНИЯ, ЭКОНОМИКИ И ТОРЕОВЛИ. -2018.-1.-С. 9- 14.
4. Makhovikov, А.В. Digital transformation in oil and gas extraction / Makhovikov, A.B., Katuntsov, E.V., Kosarev, O.V., Tsvetkov, P.S. // INNOVATION-BASED DEVELOPMENT OF THE MINERAL RESOURCES SECTOR: CHALLENGES AND PROSPECTS. -2019.-1. - pp. 531 - 538.
5. Singh, K.N. Big data ecosystem: Review on architectural evolution / Singh,
K.N., Behera, R.K., Mantri, J.K.// ADVANCES IN INTELLIGENT SYSTEMS AND COMPUTING. - 2019. - 787. - pp. 66 - 77.
6. Apache NiFi [Электронный ресурс]. - Режим доступа: https://nifi.apache.org, свободный.
7. RapidMiner [Электронный ресурс]. - Режим доступа: https://rapidminer.com/, свободный.
8. Orange [Электронный ресурс]. - Режим доступа: https://orange.biolab.si, свободный.
9. ClowdFlows [Электронный ресурс]. - Режим доступа: http://www.clowdflows.org/, свободный.
10. Pegasus [Электронный ресурс]. - Режим доступа: https://pegasus.isi.edu, свободный.
11. Kranjc, J. ClowdFlows: Online workflows for distributed big data mining / Kranjc, J., Orac, R., Podpecan, V., Lavrac, N., Robnik-Sikonja, M. // FUTURE GENERATION COMPUTER SYSTEMS. - 2017. - 68. - C. 38 - 58.
12. Deelman, E. Pegasus, a workflow management system for science automation / Deelman, E., Vahi, K., Juve, G., Rynge, M., Callaghan, S., Maechling, P.J., Mayani, R., Chen, W., Ferreira D., Silva, R., Livny, M., Wenger, K.// FUTURE GENERATION COMPUTER SYSTEMS. - 2015. - 46. - pp. 17 - 35.
13. Chen, W.-P. Performance comparison on the heterogeneous file system in
cloud storage systems / Chen, W.-P., Liu, C.-M. // IEEE INTERNATIONAL CONFERENCE ON COMPUTER AND INFORMATION
TECHNOLOGY. - 2017. - 16. - C. 694 - 701.
14. Vaidya, M. Comparative analysis of various distributed file systems & performance evaluation using map reduce implementation / Vaidya, M., Deshpande, S. // INTERNATIONAL CONFERENCE ON RECENT ADVANCES AND INNOVATIONS IN ENGINEERING. — 2017. — 16. -
C. 1 -6.
15. GlusterFS [Электронный ресурс]. - Режим доступа:
https://www.gluster.org/, свободный.
16. Lustre [Электронный ресурс]. - Режим доступа: http://lustre.org/, свободный.
17. Ceph [Электронный ресурс]. - Режим доступа: https://ceph.com/, свободный.
18. Python [Электронный ресурс]. - Режим доступа: https://www.python.org/, свободный.
19. R language [Электронный ресурс]. - Режим доступа: https://www.r-project.org/, свободный.
20. Go language [Электронный ресурс]. - Режим доступа: https://golang.org/, свободный.
21. Java language [Электронный ресурс]. - Режим доступа:
https://www.java.com/ru/, свободный.
22. C++ language [Электронный ресурс]. - Режим доступа:
https://isocpp.org/, свободный.
23. HDF5 for Python [Электронный ресурс]. - Режим доступа: https://www.h5py.org/, свободный.
24. watchdog [Электронный ресурс]. - Режим доступа:
https://pythonhosted.org/watchdog/, свободный.
25. pyinotify [Электронный ресурс]. - Режим доступа:
https://github.сот/dsoprеа/РуInotify, свободный.
26. treewatcher [Электронный ресурс]. - Режим доступа: https://github.com/jbd/treewatcher, свободный.
27. Matplotlib [Электронный ресурс]. - Режим доступа: https://matplotlib.org/, свободный.
28. Veusz [Электронный ресурс]. - Режим доступа: https://veusz.github.io/, свободный.
29. Vega [Электронный ресурс]. - Режим доступа: https://vega.github.io/, свободный.
30. VTK [Электронный ресурс]. - Режим доступа: https://www.vtk.org/, свободный.
31. Glumpy [Электронный ресурс]. - Режим доступа: http: // glumpy. github. io/, св о бо дный.
https://docs.python.Org/3/library/unittest.html, свободный.
33. tox [Электронный ресурс]. - Режим доступа: https://tox.readthedocs.io/en/latest, свободный.
34. PyQt [Электронный ресурс]. - Режим доступа: https://riverbankcomputing.сот/software/pyqt/intro, свободный.
35. wxPython [Электронный ресурс]. - Режим доступа:
http s: //wxpython. org/, сво бодный.
36. Sublime Text 3 [Электронный ресурс]. - Режим доступа: https://www.sublimetext.com/, свободный.
37. PyLint [Электронный ресурс]. - Режим доступа: https://www.pylint.org/, свободный.
38. ParaView [Электронный ресурс] - Режим доступа:
https://www.paraview.org/, свободный.
39. Хабетдинов, Р.И. Разработка комплекса визуализации больших данных, полученных с сейсмодатчиков нефтяного месторождения, с использованием Paraview: дипл. работа (выпускная квалификационная работа бакалавра прикладной информатики). Казанский федеральный университет, Казань, 2017.
40. Большие данные в IT [Электронный ресурс]. - Режим доступа: https://postnauka.ru/specials/big-data, свободный.
41. Программирование потоков данных [Электронный ресурс]. - Режим доступа:
https://ru. wikipedia.org/wiki/Программирование потоков данных, свободный.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ