Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

Как не потерять миллионы на SLA: архитектурный подход к управлению ожиданиями

Reliability Engineering

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Доклад о том, как построить SLO для платформенных решений, которые действительно будут приносить пользу. Рассмотренные в докладе реальные кейсы, архитектурный подход и разбор ошибок помогут переосмыслить управление надёжностью платформ.

Целевая аудитория

SRE-инженеры, технические менеджеры и руководители поддержки

Тезисы

В мире высоких требований к надёжности платформ часто бывает так, что SLA становятся больше головной болью, чем инструментом стабильности. Создание SLA, которые действительно работают, а не просто выглядят красиво на бумаге, требует глубокого понимания архитектуры систем и грамотного управления ожиданиями клиентов.

В своём докладе я поделюсь, как мы прошли путь от неэффективных и бессмысленных метрик, родившихся из попыток «угодить всем», к архитектурно обоснованным SLA, которые реально работают. Вы узнаете, почему классические SLI вроде Latency и доступности прокси могут быть пустой тратой ресурсов, и как инженерное видение помогло нам найти баланс между техническими возможностями и потребностями бизнеса.

Я расскажу, как анализ компонентов платформы позволил выстроить последовательность работы, связать это с метриками и алертами, и создать план внедрения адекватных SLA. Поговорим о непростых технических компромиссах, неожиданностях, и почему инженерные лидеры не должны бояться отказаться от "фальшивых" метрик. Этот доклад — для тех, кто хочет научиться строить SLA, которые защищают ваши системы и бизнес, а не становятся причиной бессонных ночей.

Игорь Цупко

Лемана Тех (Леруа Мерлен)

У Игоря за плечами более 13 лет в разработке и DevOps: от разработчика до топ-менеджера.
Имеет опыт работы на менеджерских позициях и хорошо понимает потребности потенциальных заказчиков команды. Не боится поработать «руками» и погрузиться в реальную практику. Стремится выработать и распространить в команде лучшие практики.
Ведет телеграм-канал t.me/lovely_it_hell, где делится наблюдениями и хорошим контентом.

Лемана Тех (Леруа Мерлен)

Лемана Тех — ИТ-компания, которая строит технологическую платформу для бренда Лемана ПРО (Леруа Мерлен)*. Мы создаем ИТ-инфраструктуру, которая улучшает клиентский опыт и делает его бесшовным. Лемана Тех переосмысливает DIY-ритейл, поэтому в компании можно с нуля создавать прорывные диджитал-решения, примерять разные роли, использовать современные технологии и запускать новые продукты. Мы меняем, изменяясь! Лемана Тех — это одно из мест для трансформации твоего опыта. Здесь в постоянной динамике находятся и люди, и знания, и продукты, и технологии. Отличная среда для того, чтобы расширить границы своей экспертизы. Сейчас в более 140 продуктовых командах компании работает более 1200 ИТ-специалистов. *Лема́на ПРО (Леруа Мерлен) — компания-ритейлер, специализирующаяся на продаже товаров и услуг для строительства, отделки и обустройства дома, дачи и сада. Лидер рынка DIY в России. В настоящее время сеть насчитывает 112 магазинов, 11 дарксторов, 6 распределительных центров.

Видео

Другие доклады секции

Reliability Engineering