Конференция завершена. Ждем вас на DevOpsConf в следующий раз!

Зачем Google нужен SRE, или Хостер п.д.р SRE-практики

Программный комитет ещё не принял решения по этому докладу
Тезисы

В два часа ночи приходит алерт — «виртуалка с базой данных недоступна!»
Шеф, все пропало! Сервис лежит час.
На утро оказывается, что у вашего хостера произошел сбой.

Менеджер пишет письмо провайдеру. Провайдер в очередной раз сильно извиняется, говорит, что такого больше не произойдет, даже, возможно, соглашается на выплату каких-то штрафов.

Всем же понятно, кто тут п.д.р?
Или нет?

Факапы бывают у всех, и я расскажу историю о том, как сделать, чтобы даже если виноват провайдер, у вас все было хорошо.
Я расскажу, зачем Google придумал SRE, какую пользу из этой практики извлекают провайдеры и их пользователи.
Мы поговорим про SLA, кто и как должен его соблюдать.
Я покажу конкретные примеры факапов облачных провайдеров, расскажу, кто виноват и почему рабочее приложение лучше извинений.

Павел Селиванов
Yandex Cloud

Продуктовый архитектор Yandex Cloud.
Занимается развитием сервисов Managed Kubernetes, Observability и DevTools.
Является соавтором нескольких курсов по Kubernetes, DevOps и SRE.

Telegram: @pjamm
Почта: poselivanov@gmail.com
LinkedIn: linkedin.com/in/pjamm