3 буквы, которые должны объединить всех.
Доклад отклонён
Тезисы
Краткая история длинного пути эволюции подходов к осмысленной эксплуатации распределенных систем, состоящих их сотен высоконагруженных микросервисов, которые разрабатывают десятки команд. Поговорим о том, с какими проблемами сталкиваются в IT и бизнесе в вопросах мониторинга, процессов эксплуатации. Обсудим, как мы понимаем для себя SLA и как оно должно синхронизировать контексты разных участников. Расскажем, как мы в Tinkoff научились в реальном времени оценивать уровень доступности клиентских сервисов, построили вокруг этого процессы SRE и как стараемся держать этот уровень под контролем.
Выстраиваю в Tinkoff сервисы и подходы, повышающие качество эксплуатируемых продуктов последние 5 лет. Прошел весь путь от ручного администрирования вендорских монолитов к большим распределенным системам и перестроил работу над их эксплуатацией. Занимаюсь развитием систем мониторинга и управления доступностью, внедрением ML в процессы инцидент-менеджмента и построением инфраструктуры для повышения уровня клиентского сервиса Tinkoff.
Tinkoff
Видео
Другие доклады секции
DevOps-трансформация