Что мы узнали об SRE, когда обработали первые 150к production инцидентовSRE-практики

Доклад принят в программу конференции
Матвей Кукуй
Amixr.IO

CEO компании Amixr.IO, ex. Cisco CA

Тезисы

Мы в Amixr.IO пропускаем через свой бекенд production инциденты клиентов. Готовы поделиться статистикой, инсайтами о том, как десятки команд по всему миру дежурят, разбирают инциденты, организуют работу и строят надежные системы. Это вариант вводной лекции по SRE через кейсы из реальной жизни, подкрепленные статистикой и нашим опытом.

Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
,
Менеджмент в эксплуатации
,
Devops / другое

Другие доклады секции SRE-практики