Лучшие SRE-практики. Как мы ускорили решение инцидентов за счёт маппинга

Reliability Engineering

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как превратить постмортем в единый артефакт и ускорить решение инцидентов? Бизнес-сценарий, документация, мониторинг, алерты и замеры синтетики в одном документе.

Целевая аудитория

SRE; архитекторы; аналитики; эксплуатация.

Тезисы

Поговорим о том, как внедрить лучшие SRE-практики. Как избавиться от избыточного мониторинга и контролировать продукт с одного экрана. А также о реализации работающего маппинга в высоконагруженном приложении.

Владимир Перфильев

МТС Диджитал

SRE Cluster Lead.
Отвечает за доступность 16 продуктов, несколько из которых самые ключевые в МТС. Высоконагруженная CRM и Контактные центры.

МТС Диджитал

МТС — мультисервисная цифровая экосистема и ведущий телеком-оператор в России. Компания развивает сервисы и продукты в сфере больших данных, искусственного интеллекта, облачного хранения, медиа и финансов, телекоммуникаций. Штат IT-специалистов превышает 10 тыс. человек.

Видео

Другие доклады секции

Reliability Engineering