Проверка - это задача, которая выполняется через определённый интервал времени и проверяет исправность определенной функции компонента.
Например, в целях мониторинга работы сайта можно раз в 10 минут выполнять проверку, что главная страница сайта успешно открывается.
Важно!
У каждого результата проверки есть время актуальности, если время актуальности прошло, а нового результата проверки нет ("умер" сервер, не работает сеть), проверка считается неисправной. Таким образом, если проверка выполнилась с ошибкой или проверка не выполнялась, вы получите об этом уведомление. Проверка будет в статусе success только, если она выполнилась успешно и её последний результат в настоящий момент актуален.
Если Вы знакомы с юнит-тестированием (unit testing), то проверка - это юнит-тест. Классический юнит-тест выполняется в тестовой среде на этапе разработки, а проверка выполняется в рабочей среде на этапе эксплуатации.
У компонента может быть любое количество проверок. Чем больше проверок, тем более точно выполняется проверка исправности компонента.
Результат выполнения проверки имеет значения:
alarm |
проверка выполнена с ошибкой
например, не открывается страница сайта |
|
warning |
проверка выполнена без ошибок, но необходимо обратить внимание
например, осталось мало дней до окончания срока оплаты домена |
|
success |
проверка выполнена без ошибок, всё хорошо
например, страница сайта успешно открывается |
|
unknown | неизвестно |
Например, у Вас есть веб-приложение. Будем считать, что с веб-приложением все в порядке, если:
Чтобы автоматизировать проверку требований выше, необходимо создать компонент "My site". Для данного компонента добавить проверку Http, Domain, Ssl.
Проверки бывают пользовательские и системные.
Системная проверка — это проверка, которая уже реализована в системе мониторинга Zidium, её нужно только настроить в личном кабинете для соответствующего компонента. Выполнением системных проверок занимется агент Zidium.
Типы системных проверок:
Пользовательская проверка — это проверка, которую Вы разрабатываете самостоятельно. Пользовательскую проверку Ваше приложение выполняет самостоятельно, а результат проверки передаёт в систему монторинга Zidium через API или веб-сервис.
Время актуальности результата проверки
У проверок есть важная особенность — каждая проверка должна выполнятся непрерывно, последний результат проверки должен быть всегда актуальным. Чтобы понимать, когда результат проверки стновится неактуальным, у каждого результата проверки указывается время актуальности. Если последний результат проверки перестает быть актуальным (нет сигнала), проверка переходит в статус alarm.
Таким образом, проверка может перейти в статус alarm, если результат последнего выполнения имеет значение alarm, или последний результат выполнения проверки становится неактуальным (нет сигнала).
Время актуальности результата проверки гарантирует, что проверка всегда будет иметь актуальный статус.
Например, Ваше приложение отправляет раз в час пользовательскую проверку "со мной всё в порядке". Время актуальности результата проверки 2 часа. В 11:00 приложение отправило результат success, а в 12:00 сервер на котором работало приложение выключился. В 13:00 система мониторинга Zidium обнаружит, что от проверки нет сигнала, переведет проверку в статус alarm, соответствующий компонент тоже получит статус alarm, техническая поддержка получит email-уведомление.