Как SLO водят вас за нос
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Вы много раз слышали, что такое SLO, как оно полезно, даже как его определять, но уверены ли в достоверности данных?
Представь: ты проверяешь показатели SLO — и там все хорошо, но пользователи жалуются; ты пересматриваешь с командой SLO — и снова ситуация повторяется; на третий раз ты начинаешь подозревать неладное...
Возможно, вы и раньше замечали странности в данных, но не придавали этому значения, теперь вы посмотрите на это иначе. Я покажу случаи, как вас могут обманывать с SLO, как правильно посчитанные SLO могут вводить в заблуждение, что делать, чтобы этого избежать.
SR-инженер (SRE). Более 5 лет строит и эксплуатирует отказоустойчивые системы, сопровождает их, обрабатывает и анализирует сбои. Помогает увидеть уровень сервиса через SLI/SLO. Строит систему сбора логов.
Более 20 лет в ИT, из них 14 лет в разработке. Начал с сисадмина, дошел до руководителя группы программистов, а потом перешел в backend-разработку, где увлекся темой надежности систем и стал SRE.
Имеет опыт работы в сфере телекоммуникаций, финтеха и ретейла.
Спикер IT-конференций, член ПК DevOpsConf.
Автор телеграм-группы «ALLSO - все про SLO» https://t.me/allslo_ru. Сообщество https://github.com/ALLSLO-COMMUNITY/
Ведет свой телеграм канал «Летит Кит» про SRE и разработку https://t.me/letitkit
Сейчас - инженер по надежности в Ви.Tech, https://vitech.team
Видео
Другие доклады секции
DevOps практики и культура