🤝🗣Круглый стол «Я знаю три SLOва...»
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Три буквы, три слова, а сколько в них уже вложено и будет еще вложено сил.
В кругу экспертов обсудим вызовы, поделимся лайфхаками о том, как в крупных компаниях выстраивают работы с SL(O|A|I).
* Надежность — это не ответственность SRE, а инструмент и показатель всей команды. Так ли это?
* Работает ли бюджет ошибок в реальном мире?
* SLO — когда их можно/нужно пересматривать?
* Плохая минута или бюджет ошибок?
* Что делать, когда «да, у меня просел SLI, но это <коллега из другой команды> — он кривой сервис сделал, а мы от него зависим»?
SRE. Работал инженером в телекоме, после чего ушел в финтех. Руководил командой SRE/DevOps на крупном финтех-проекте. Занимался внедрением практик DevOps и инцидент-менеджмента. С 2021 года SRE-инженер в компании VK. Занимается развитием практик мониторинга, алертинга, инцидент-менеджмента. Преподаватель и спикер конференций.
VK
SRE Lead. 5 лет непрерывной практики эксплуатации production-систем, проектирования отказоустойчивых систем, борьбы со сбоями и их качественного анализа.
Независимый эксперт
SR-инженер (SRE). 4 года строит и эксплуатирует отказоустойчивые системы, сопровождает их, обрабатывает и анализирует сбои. Помогает увидеть уровень сервиса через SLI/SLO. Строит систему сбора логов.
Более 10 лет в разработке, более 18 лет в IT. Начал с сисадмина, дошел до руководителя группы программистов, а потом перешел в backend-разработку, где увлекся темой надежности систем и стал SRE.
Имеет опыт работы в сфере телекоммуникаций, финтеха и ретейла.
Автор телеграм-группы «ALLSO — все про SLO».
Сейчас — инженер по доступности сервиса в Ви. Tech.
Ви.Tech
SRE, пытается выстроить идеальный мир, основанный на трёхбуквенных словах.
Cloud.ru
В айти с божественного 2007 года. За это время повидал многое, от SAN-фабрик до магистральных сетей и от поддержки 1С до Java и Python. С 2018 года — инженер и лидер сообщества DevOps в Райффайзен Банке.
Райффайзен Банк
Unit Lead команды Architecture Governance.
Помогает Авито расти, оставаясь надежным и масштабируемым.
Авито
Видео
Другие доклады секции
Reliability Engineering