Zidium

У многих компонентов есть числовые параметры (характеристики), которые нужно держать на контроле. Например, чтобы вовремя узнать, когда на сервере заканчивается свободное место на диске.

Метрика — это числовой параметр компонента, который имеет статус, соответствующий правилам метрики (пороговым значениям).

Значения метрик передаются в систему мониторинга Zidium через API или веб-сервис.

Метрика имеет статус:

alarm метрика имеет опасное значение, технической поддержки необходимо принять меры
например, свободное место на диске сервера менее 1 ГБ
warning метрика имеет нежелательное значение, техническая поддержка должна обратить на это внимание
например, средняя нагрузка на CPU более 90 %.
success всё хорошо
unknown неизвестно

Например, у компонента "My site" могут быть метрики CPU (средняя загрузка CPU за 5 минут), HDD_FREE (cвободное место на диске), RAM (средний размер используемой оперативной памяти за 5 минут).

Допустим, из-за ошибки приложения размер БД стал резко расти, а свободное место на диске уменьшаться. Приложение раз в час отправляет метрику HDD_FREE - размер свободного диска (Gb). Для данной метрики задано условие, что если размер свободного места на диске меньше 10 Gb - статус alarm, если меньше 100 - warning, иначе - success.

По диаграмме выше видно, что в 14:00 метрика получила статус warning, т.к. ее значение стало меньше 100. В 17:00 метрика перешла в статус alarm - т.к. значение метрики стало меньше 10.

Значение метрики имеет время актуальности, если значение метрики становится неактуальным, метрика переходит в статус alarm.