Выстраиваем централизованную систему превентивного мониторинга.
Система охватывает все приложения и стеки ПО, серверы, низкоуровневые метрики, бизнес метрики и имеет алерты.
Преимущество подхода в том, что нами активно используются математические функции типа predict_linear для прогнозирования ситуаций и инцидентов с помощью проработки сценариев.
Пример: функция прогнозирования позволяет определить, что, к примеру, если приложение, которое сейчас осуществляет запись на определённый сервер, будет продолжать запись с такой же интенсивностью ещё 4 часа, то место на диске закончится или SSL сертификат истечет через 2 недели.
Таким образом, главная цель наших инженеров в том, чтобы внедрить у вас такую систему мониторинга, которая не допустит «пожаров» и заранее сообщит о возможных проблемах.