Site Reliability Engineering
ReliabilityОпределение
Site Reliability Engineering (Инженерия надежности) — это направление, которое объединяет инженерные, операционные и организационные подходы к обеспечению надежности, доступности и устойчивости сервисов.
Ценность
Технология помогает сбалансировать скорость изменений и надежность сервисов, сделать эксплуатацию более управляемой и встроить ответственность за качество работы систем в повседневную практику инженерных команд.
Применение
Технология реализуется с помощью инженерных и эксплуатационных практик обеспечения надежности, распределения ответственности за качество работы сервисов и развития культуры надежности в командах, а также связана со следующими технологиями на радаре: Incident Management, Service Level Indicator, Service Level Objectives, Error Budget, Blameless Culture, Resilience Engineering, Chaos Engineering, Disaster Recovery, Capacity Planning, Observability Platform, Team Topologies.
Контекст
Наиболее актуальна для средних и крупных технологических компаний, а также Enterprise организаций со средней и высокой инженерной зрелостью, где уже есть критичные сервисы, высокие требования к надежности, постоянный поток изменений и необходимость системно управлять качеством эксплуатации и устойчивостью сервисов.
Зрелость
Относится к уровню Adopt, потому что это направление давно доказало практическую ценность как основа современной культуры надежности и стало важной частью зрелых инженерных, платформенных и эксплуатационных практик.