Конференция завершена. Ждем вас на DevOpsConf в следующий раз!

3 буквы, которые должны объединить всех.

DevOps-трансформация

Логирование и мониторинг
Менеджмент в эксплуатации
Техдолг
Управление изменениями
Управление инцидентами
Управление уязвимостями
Надёжность продакшена
Совместное планирование и разработка
Безопасность от планирования до эксплуатации
Логи, метрики, ошибки

Доклад отклонён

Тезисы

Краткая история длинного пути эволюции подходов к осмысленной эксплуатации распределенных систем, состоящих их сотен высоконагруженных микросервисов, которые разрабатывают десятки команд. Поговорим о том, с какими проблемами сталкиваются в IT и бизнесе в вопросах мониторинга, процессов эксплуатации. Обсудим, как мы понимаем для себя SLA и как оно должно синхронизировать контексты разных участников. Расскажем, как мы в Tinkoff научились в реальном времени оценивать уровень доступности клиентских сервисов, построили вокруг этого процессы SRE и как стараемся держать этот уровень под контролем.

Выстраиваю в Tinkoff сервисы и подходы, повышающие качество эксплуатируемых продуктов последние 5 лет. Прошел весь путь от ручного администрирования вендорских монолитов к большим распределенным системам и перестроил работу над их эксплуатацией. Занимаюсь развитием систем мониторинга и управления доступностью, внедрением ML в процессы инцидент-менеджмента и построением инфраструктуры для повышения уровня клиентского сервиса Tinkoff.

Tinkoff

Видео