Лучшие SRE-практики. Как мы ускорили решение инцидентов за счёт маппинга

Reliability Engineering

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как превратить постмортем в единый артефакт и ускорить решение инцидентов? Бизнес-сценарий, документация, мониторинг, алерты и замеры синтетики в одном документе.

Целевая аудитория

SRE; архитекторы; аналитики; эксплуатация.

Тезисы

Поговорим о том, как внедрить лучшие SRE-практики. Как избавиться от избыточного мониторинга и контролировать продукт с одного экрана. А также о реализации работающего маппинга в высоконагруженном приложении.

Владимир Перфильев

МТС Диджитал

Руководитель и архитектор в области Site Reliability Engineering (SRE) с более чем 11-летним опытом в ИТ-инфраструктуре и разработке. Специализируюсь на построении и внедрении SRE-практик для обеспечения высокой надежности и отказоустойчивости бизнес-критичных сервисов.

Текущая позиция: Руководитель группы в VK. Отвечает за внедрение культуры и практик SRE в масштабах компании.

МТС Диджитал

МТС — мультисервисная цифровая экосистема и ведущий телеком-оператор в России. Компания развивает сервисы и продукты в сфере больших данных, искусственного интеллекта, облачного хранения, медиа и финансов, телекоммуникаций. Штат IT-специалистов превышает 10 тыс. человек.

Видео

Другие доклады секции

Reliability Engineering