SLO as a code — нельзя верить людям

Цифровые иммунные системы и инженерия надёжности. Хаос инжиниринг

DevOps / SRE

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

DevOps, SRE и все, кто занимается внедрением SLO/SLI. Также будет интересно разработчикам, чтобы понять, «как это работает», и лидам разного уровня — от тимлидов до Engineering Managers.

Тезисы

Расскажу как в компании внедряли SLO/SLI так, чтобы они работали предсказуемо, не ломались от человеческого фактора.
Разберём кейс: от отсутствия метрик и неудобных дашбордов до разработки собственной системы на Go + Jsonnet + Grafonnet.
Разберём, как автоматизировали генерацию метрик, упростили жизнь DevOps/SRE и сократили инциденты вдвое.

Около 10 лет в IT. Последние 3 года - SRE в Купере, продвигаю надежность, помогаю настраивать SLO/SLI

Видео