Как добыть SLO: источники и инструменты гномов SREдней полосы
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Для тех кто уже понял “Что такое SLI/SLO?” теперь станет понятно как это реализовать на практике.
Представь, ты инициативный разработчик или инженер. Ты уже узнал какая классная штука SLO и как оно помогает поддерживать работу сервисов и не замедлять разработку. Ты уже продал это руководству и команде - все жаждут увидеть это в дейтсвии. Ты полон энтузиазма и уверенности, что все быстро сделаешь, ведь, кажется, это делали много раз в разных комапниях, следуя заветам книг Google. Ты начинаешь искать готовый вариант, чтобы сделать первый MVP как можно быстрее. И понимаешь, что готового рецепта нет. Ты начинаешь поиск источников о практиках других компаний, инструментов для реализации и находишь частичные данные, но ты не знаешь насколько этот айсберг велик. А хочется по горячему, пока интерес не остыл, показать хоть что-то команде и принести пользу.
Поделюсь нашим опытом и наработкам. Я бы хотел все это знать и иметь в самом начала работы с SLO.
SR-инженер (SRE). 4 года строю и эксплуатирую отказоустойчивые системы, сопровождаю их, обрабатываю и анализирую сбои. Помогаю увидеть уровень сервиса через SLI/SLO. Строю систему сбора логов.
Более 10 лет в разработке, более 18 лет в IT. Начал с сисадмина, дошел до руководителя группы программистов, а потом перешел в backend-разработку, где увлекся темой надежности систем и стал SRE.
Имею опыт работы в сфере теллекомуникаций, финтех и ритейл
Автор телеграм группы “ALLSO - все про SLO”.
Сейчас инженер по доступности сервиса в Ви.Tech
Vi.Tech
Видео
Другие доклады секции
Reliability Engineering