Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

🗣Круглый стол "Я знаю три SLOва..."

Reliability Engineering

Доклад принят в программу конференции

Целевая аудитория

sre, разработчики, devops

Тезисы

Три буквы, три слова, а сколько в них уже вложено и будет вложено сил.
В кругу эспертов обсудим вызовы, поделимся лайфхаки, о том как в крупных компаниях выстраивают работы с SL(O|A|I)
Надежность - это не ответственность SRE, а инструмент и показатель всей команды. Так ли это?
Работает ли бюджет ошибок в реальном мире?
SLO - когда их можно/нужно пересматривать?
Плохая минута или бюджет ошибок?
Что делать когда: "да, у меня просел SLI, но это <коллега из другой команда> - он кривой сервис сделал а мы от него зависим."

SRE. Работал инженером в телекоме, после чего ушел в финтех. Руководил командой SRE/DevOps на крупном финтех проекте. Занимался внедрением практик DevOps и инцидент-менеджмента. С 2021 года в компании VK - SRE инженер. Занимаюсь развитие практик мониторинга, алертинга, инцидент-менеджмента. Преподаватель и спикер конференций.

VK

VK — это более 200 технологичных проектов, больше 11 000 сотрудников и безграничные возможности проявить себя. Каждый день миллионы людей общаются ВКонтакте и в ОК, находят новое в Дзене, на VK Маркете и в RuStore, играют с VK Play и общаются с Марусей, предприниматели и разработчики используют решения VK Cloud и строят высоконагруженные сервисы с Tarantool. Мы делаем жизнь проще и интереснее!
Сергей Реусин

Независимый эксперт

SRE Lead. 5 лет непрерывной практики эксплуатации production-систем, проектирования отказоустойчивых систем, борьбы со сбоями и их качественного анализа.

Независимый эксперт

-

SR-инженер (SRE). 4 года строю и эксплуатирую отказоустойчивые системы, сопровождаю их, обрабатываю и анализирую сбои. Помогаю увидеть уровень сервиса через SLI/SLO. Строю систему сбора логов.
Более 10 лет в разработке, более 18 лет в IT. Начал с сисадмина, дошел до руководителя группы программистов, а потом перешел в backend-разработку, где увлекся темой надежности систем и стал SRE.
Имею опыт работы в сфере телекоммуникаций, финтех и ритейл
Автор телеграм группы “ALLSO - все про SLO”.

Сейчас я инженер по доступности сервиса в Ви.Tech

Ви.Tech

Ви.Tech — это команда инженеров, которая строит IТ для ВИ.ру — одного из крупнейших игроков на рынке e-commerce.

SRE, пытаюсь выстроить идеальный мир, основанный на трёхбуквенных словах.

Cloud.ru

Cloud․ru — провайдер облачных сервисов и AI-технологий, который делает доступ к облакам и искусственному интеллекту простым и удобным. В Cloud․ru есть 100+ IaaS- и PaaS-сервисов, ML-платформа на базе суперкомпьютеров и публичное облако Cloud․ru Evolution на основе собственных разработок и open source. В команде провайдера более 1 500 специалистов в области IT, кибербезопасности и AI. Cloud․ru входит в число крупнейших IT-компаний России.
Михаил Морев

Райффайзен Банк

В айти с божественного 2007 года. За это время повидал многое, от SAN-фабрик до магистральных сетей и от поддержки 1С до Java и Python. С 2018 года — инженер и лидер сообщества DevOps в Райффайзен Банке.

Райффайзен Банк

Райффайзен Банк — часть австрийской банковской группы Raiffeisen Bank International. Работают в России с 1996 года и входят в тройку самых надежных российских банков по версии Forbes. В команде Райфа более 3000 IT-специалистов, которые работают над продуктами будущего и развивают финтех в России. И не любят легаси.

Unit Lead команды Architecture Governance.
Помогаю Авито расти, оставаясь надежным и масштабируемым

Авито

На Авито каждый может найти что-то своё среди миллионов частных объявлений и предложений компаний. У них десятки тысяч RPS к бэкенду, терабайты картинок в хранилище и мощная система автоматизированной модерации на базе машинного обучения. Каждый месяц сервисом пользуется треть населения России.

Видео

Другие доклады секции

Reliability Engineering