Error Budget
ReliabilityОпределение
Error Budget (Бюджет ошибок) — это практика управления допустимым уровнем ненадежности сервиса на основе целевых показателей качества, доступности и допустимого объема нарушений.
Ценность
Технология помогает сбалансировать скорость изменений и надежность сервиса, сделать решения о релизах и рисках более прозрачными и связать инженерные приоритеты с фактическим качеством работы системы.
Применение
Технология реализуется с помощью Service Level Objectives, Service Level Indicator, Service Level Agreement, анализа нарушений доступности и качества сервиса, правил управления релизами и приоритизации работ по повышению надежности, а также связана со следующими технологиями на радаре: Site Reliability Engineering, Incident Management, Change Management, Resilience Engineering, Chaos Engineering, Disaster Recovery, Observability Platform.
Контекст
Наиболее актуальна для средних и крупных технологических компаний, а также Enterprise организаций со средней и высокой инженерной зрелостью, где уже есть production-критичные сервисы, измеримые требования к надежности и необходимость осознанно управлять компромиссом между скоростью поставки и стабильностью систем.
Зрелость
Относится к уровню Trial, потому что эта практика уже демонстрирует высокую практическую ценность в зрелых reliability-oriented организациях, но ее системное внедрение все еще требует развитой Observability платформы, SLI/SLO метрик и управленческой готовности принимать решения на основе показателей надежности.