Метрики для метрик: Опыт выстраивания SLOs/SLIs для платформы мониторинга
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Уже давно не секрет, что в Т-Банк есть своя observability-платформа Sage.
Внутри банка, мы предоставляем сервис мониторинга, у которого ежедневно более 5000 активных пользователей(DAU).
И как это принято, у нас есть SLA с нашими пользователями,
но "как понять предоставляем ли мы сейчас услугу или нет?" - именно с этого вопроса начинатся мой рассказ о построении SLOs/SLIs для нашей платформы Sage. Метрики для метрик.
На примере домена метрик в Sage, в своем докладе я расскажу:
* как мы измеряем надежность;
* как мы строили SLOs/SLIs;
* как мы работали с нашими клиентами, чтобы выявить их ожидания от нашей надежности;
* как выглядит наша подсистема метрик на сегодня
Доклад будет интересен как экспертам, так и людям, которые только погружаются в тему построения SLOs/SLIs
Опыт в IT более 15 лет. Последние несколько лет является SRE-инженером в Т-Банке в команде Sage.
За свою карьеру успешно выполнял различные роли, в том числе разработчика, архитектора и управленца. Как правило, всегда работает над задачами с высокой неопределенностью.
https://www.linkedin.com/in/ruslan-boyarskiy/
T-Банк
Видео
Другие доклады секции
Reliability Engineering