Зачем Google нужен SRE, или Хостер п.д.р SRE-практики
В два часа ночи приходит алерт — «виртуалка с базой данных недоступна!»
Шеф, все пропало! Сервис лежит час.
На утро оказывается, что у вашего хостера произошел сбой.
Менеджер пишет письмо провайдеру. Провайдер в очередной раз сильно извиняется, говорит, что такого больше не произойдет, даже, возможно, соглашается на выплату каких-то штрафов.
Всем же понятно, кто тут п.д.р?
Или нет?
Факапы бывают у всех, и я расскажу историю о том, как сделать, чтобы даже если виноват провайдер, у вас все было хорошо.
Я расскажу, зачем Google придумал SRE, какую пользу из этой практики извлекают провайдеры и их пользователи.
Мы поговорим про SLA, кто и как должен его соблюдать.
Я покажу конкретные примеры факапов облачных провайдеров, расскажу, кто виноват и почему рабочее приложение лучше извинений.
Developer Advocate в VK Cloud Solutions.
Фанат Kubernetes.
Специализируется на DevOps-культуре и инструментах.
Является соавтором нескольких курсов по Kubernetes, DevOps и SRE.
Почта: poselivanov@gmail.com
LinkedIn: linkedin.com/in/pjamm