Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

Лучшие практики управления инцидентами и проблемами

Reliability Engineering

Доклад принят в программу конференции

Целевая аудитория

менеджеры инцидентов, менеджеры проблем, специалисты технической поддержки, тим-лиды, SRE

Тезисы

Как делиться результатами Postmortem с командами
Эффективная ролевая модель во время инцидента
Метрики успеха: как измерить достижения

В управлении инцидентами уже собрано много практик, в докладе расскажу про две, на мой взгляд, самые важные задачи на старте процесса — ролевую модель при инциденте и Postmortem с командами.

В докладе расскажу как эффективно делиться результатами Postmortem с командами, чтобы что сократить их бэклог, эффективнее управлять проблемами (правильно приоритизировать, заносить в команды, давать инструменты в виде дашбордов для отслеживания, добавлять новые активности в виде комитетов и review) и тратить меньше времени на управление. А также как выстроить эффективную ролевую модель во время инцидента (назначение, функции, резолвинг).

Измерим результаты использования эффективной ролевой модели: время на митигирование, резолвинг, количество повторений и время реакций.

Люблю IT, параглайдинг и тёплые страны

Lamoda Tech

Lamoda Tech обладает великолепной корпоративной культурой и привлекает много ценных специалистов

Видео

Другие доклады секции

Reliability Engineering