Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

Метрики для метрик: Опыт выстраивания SLOs/SLIs для платформы мониторинга

Reliability Engineering

Базы данных / другое
Распределенные системы
Логирование и мониторинг
Хранилища

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

SRE, Менеджеры продукта, архитектора, разработчики

Тезисы

Уже давно не секрет, что в Т-Банк есть своя observability-платформа Sage.
Внутри банка, мы предоставляем сервис мониторинга, у которого ежедневно более 5000 активных пользователей(DAU).

И как это принято, у нас есть SLA с нашими пользователями,
но "как понять предоставляем ли мы сейчас услугу или нет?" - именно с этого вопроса начинатся мой рассказ о построении SLOs/SLIs для нашей платформы Sage. Метрики для метрик.

На примере домена метрик в Sage, в своем докладе я расскажу:
* как мы измеряем надежность;
* как мы строили SLOs/SLIs;
* как мы работали с нашими клиентами, чтобы выявить их ожидания от нашей надежности;
* как выглядит наша подсистема метрик на сегодня

Доклад будет интересен как экспертам, так и людям, которые только погружаются в тему построения SLOs/SLIs

Мой опыт в IT более 15 лет. Последние несколько лет являюсь SRE инженером в Т-Банк в команде Sage,

За свою карьеру успешно выполнял различные роли, в том числе разработчика, архитектора и управленца. Как правило всегда работаю над задачами с высокой неопределенностью.

https://www.linkedin.com/in/ruslan-boyarskiy/

T-Банк

Команда Т-Банка — это разработчики, тестировщики, SRE-инженеры, архитекторы, аналитики, продакт-менеджеры, дизайнеры и другие специалисты. Вместе они создают финтех-продукты, которыми пользуются около 40 миллионов клиентов. Т-Банк развивает ИТ-индустрию, поддерживает комьюнити и делится экспертизой.

Видео