ВВЕДЕНИЕ 5
1 Оценка современного состояния исследуемой проблемы 6
2 Постановка задачи 6
3 Общие сведения о мониторинге 7
3.1 Понятие и сущность мониторинга 7
3.2 Задачи мониторинга 7
4 Обзор существующих систем и комплексных решений мониторинга 8
4.1 Ganglia 8
4.1.1 Назначение и применение 8
4.1.2 Демоны 9
4.1.3 Модули 10
4.1.4 Веб-интерфейс 10
4.2 IBM-Director 12
4.2.1 Компоненты 13
4.2.2 Применение 13
4.3 Nagios 14
4.4 Zenoss 15
4.5 Zabbix 17
4.5.1 Возможноста^аЬЫх 19
4.5.2 Архитектура и основные понятия Zabbix 20
4.6 Rittal СМС-ТС 22
5 Сравнение существующих систем 24
6 Организация мониторинга в комплексе высокопроизводительных вычислений
СФУ 24
6.1 Общие сведения о комплексе 24
6.2 Организация мониторинга 26
6.3 Недостатки текущей организации 26
7 Разработка системы мониторинга 27
7.1 Формирование требований к системе 27
7.2 Выбор основного языка программирования 28
7.3 Преимущества и недостатки выбранного языка 29
7.4 Архитектура системы мониторинга 30
7.4.1 Ядро системы 31
7.4.2 Модули 31
7.4.3 Хранилище данных 32
7.4.4 Объекты мониторинга 32
7.4.5 Точка входа (веб-интерфейс) 32
7.5. Проектирование системы мониторинга 33
7.5.1 Проектирование модуля загрузки узлов 33
7.5.2 Выбор технологий и спецификации 38
7.5.3 Организация хранилища данных 40
7.5.3.1 Выбор СУБД 40
7.5.3.2 Модель базы данных 42
7.5.4 Веб-интерфейс 45
7.5.4.1 Назначение 45
7.5.4.2 Выбор технологий и инструментов 46
7.5.4.3 Структура проекта 48
7.5.4.4 Описание приложений проекта 50
7.5.4.4.1 Приложение home 50
7.5.4.4.2 Приложение user 52
7.5.4.4.3 Приложение modules 54
7.5.4.4.4 Приложение modules.monitoring_nodes 54
7.5.4.4.5 Приложение modules.monitoring_nodes.graph 55
7.5.4.5 Визуализация веб-интерфейса 58
ЗАКЛЮЧЕНИЕ 63
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 64
ПРИЛОЖЕНИЕ
Эффективное управление сложной и динамичной системой, прогнозирование ее изменений возможно только на основе сбора и анализа непрерывного потока информации о ее состоянии, а также закономерностях всей совокупности процессов, протекающих в ней. Поэтому для действенного и качественного управления любыми процессами необходимо постоянно в режиме реального времени наблюдение и слежение за состоянием системы. Так, на сегодняшний день наиболее важным инструментом наблюдения, анализа и прогнозирования, а также фактором в принятии обоснованных и наиболее эффективных решений, является система мониторинга [1].
Задача комплексного мониторинга больших центров обработки данных является актуальной. Администраторы подобных комплексов должны получать и анализировать множество параметров, объектов и сущностей - от загрузки процессора до инженерных параметров состояния помещения комплекса, и комплекс высокопроизводительных вычислений СФУ не является исключением.
В настоящее время система проходит этап тестирования и проверки работоспособности на оборудовании суперкомпьютерного комплекса СФУ. Система имеет всего лишь один модуль по мониторингу загрузке узлов и обеспечивает весь его необходимый функционал. В дальнейшем функционал данного модуля будет улучшаться и расширяться, будут реализованы новые модули. Исходный код системы расположен в репозитории на github.com, благодаря чему система может получить поддержку open-source сообщества и в стезе применения выйти за рамки комплекса высокопроизводительных вычислений СФУ.