SLI/SLO as code
ReliabilityОпределение
SLI/SLO as code — это практика, при которой показатели и цели уровня сервиса описываются, хранятся и управляются в виде кода и версионируемых конфигураций.
Ценность
Технология помогает сделать управление надежностью более воспроизводимым, прозрачным и масштабируемым, а также встроить SLI и SLO в стандартные инженерные процессы и платформенные механизмы автоматизации.
Применение
Технология реализуется с помощью декларативного описания SLI и SLO в системе контроля версий, автоматизированного применения и пересмотра конфигураций надежности, а также связана со следующими технологиями на радаре: Service Level Indicator, Service Level Objectives, Error Budget, Site Reliability Engineering, Monitoring as Code, Observability Platform, OpenTelemetry, Prometheus, Grafana, VictoriaMetrics.
Контекст
Наиболее актуальна для средних и крупных технологических компаний, а также Enterprise организаций со средней и высокой инженерной зрелостью, где управление надежностью уже опирается на измеримые показатели, большое число сервисов и необходимость стандартизировать практики надежности между командами и окружениями.
Зрелость
Относится к уровню Trial, потому что эта практика уже демонстрирует практическую ценность для масштабирования SLI/SLO подхода и его интеграции в инженерный цикл, но ее системное применение пока остается менее распространенным, чем у более базовых практик наблюдаемости и надежности.