🤝🗣Круглый стол «Я знаю три SLOва...»

Reliability Engineering

Доклад принят в программу конференции

Целевая аудитория

SRE, разработчики, DevOps.

Тезисы

Три буквы, три слова, а сколько в них уже вложено и будет еще вложено сил.

В кругу экспертов обсудим вызовы, поделимся лайфхаками о том, как в крупных компаниях выстраивают работы с SL(O|A|I).
* Надежность — это не ответственность SRE, а инструмент и показатель всей команды. Так ли это?
* Работает ли бюджет ошибок в реальном мире?
* SLO — когда их можно/нужно пересматривать?
* Плохая минута или бюджет ошибок?
* Что делать, когда «да, у меня просел SLI, но это <коллега из другой команды> — он кривой сервис сделал, а мы от него зависим»?

SRE. Работал инженером в телекоме, после чего ушел в финтех. Руководил командой SRE/DevOps на крупном финтех-проекте. Занимался внедрением практик DevOps и инцидент-менеджмента. С 2021 года SRE-инженер в компании VK. Занимается развитием практик мониторинга, алертинга, инцидент-менеджмента. Преподаватель и спикер конференций.

VK

VK развивает более 200 высоконагруженных проектов, которыми пользуются миллионы людей. Они общаются и развлекаются ВКонтакте и в ОК, находят новое в Дзене, VK Видео, VK Музыке и RuStore, а инструменты СМБ и продукты VK Tech помогают расти бизнесу. И это лишь часть продуктов.
Сергей Реусин

Независимый эксперт

SRE Lead. 5 лет непрерывной практики эксплуатации production-систем, проектирования отказоустойчивых систем, борьбы со сбоями и их качественного анализа.

Независимый эксперт

-

SR-инженер (SRE). 4 года строит и эксплуатирует отказоустойчивые системы, сопровождает их, обрабатывает и анализирует сбои. Помогает увидеть уровень сервиса через SLI/SLO. Строит систему сбора логов.
Более 10 лет в разработке, более 18 лет в IT. Начал с сисадмина, дошел до руководителя группы программистов, а потом перешел в backend-разработку, где увлекся темой надежности систем и стал SRE.
Имеет опыт работы в сфере телекоммуникаций, финтеха и ретейла.
Автор телеграм-группы «ALLSO — все про SLO».

Сейчас — инженер по доступности сервиса в Ви. Tech.

Ви.Tech

Ви.Tech — это команда инженеров, которая строит IТ для ВИ.ру — одного из крупнейших игроков на рынке e-commerce.

SRE, пытается выстроить идеальный мир, основанный на трёхбуквенных словах.

Cloud.ru

Cloud․ru — провайдер облачных сервисов и AI-технологий, который делает доступ к облакам и искусственному интеллекту простым и удобным. В Cloud․ru есть 100+ IaaS- и PaaS-сервисов, ML-платформа на базе суперкомпьютеров и публичное облако Cloud․ru Evolution на основе собственных разработок и open source. В команде провайдера более 1 500 специалистов в области IT, кибербезопасности и AI. Cloud․ru входит в число крупнейших IT-компаний России.
Михаил Морев

Райффайзен Банк

В айти с божественного 2007 года. За это время повидал многое, от SAN-фабрик до магистральных сетей и от поддержки 1С до Java и Python. С 2018 года — инженер и лидер сообщества DevOps в Райффайзен Банке.

Райффайзен Банк

Райффайзен Банк работает в России с 1996 г. и входит в тройку самых надежных российских банков по версии Forbes. В Райфе более 3000 IT-специалистов развивают финтех в России и создают качественные и удобные сервисы для людей и бизнеса. И не любят легаси.

Unit Lead команды Architecture Governance.
Помогает Авито расти, оставаясь надежным и масштабируемым.

Авито

На Авито каждый может найти что-то своё среди миллионов частных объявлений и предложений компаний. У них десятки тысяч RPS к бэкенду, терабайты картинок в хранилище и мощная система автоматизированной модерации на базе машинного обучения. Каждый месяц сервисом пользуется треть населения России.

Видео

Другие доклады секции

Reliability Engineering