Конференция завершена.

Ждем вас

на DevOpsConf

в следующий раз!

Автоматизируй это немедленно! Инциденты, когда на кону большие деньги

Инциденты и постмортемы

Devops / другое
Коммуникация
Управление командой
Управление инцидентами
Лайфхаки

Доклад принят в программу конференции

Целевая аудитория

* Monitoring Team. * Incident/Problem manager. * SRE. * Backend/Frontend developer. * Руководители групп/отделов/управлений, которые работают с инцидентами. * Project/Product manager/owner.

Тезисы

  • Мы расскажем о том, как в Купере создавали процессы управления инцидентами: реакция и обработка алертов, коммуникация со смежными командами, эскалация инцидентов.
  • Расскажем про формирование «Команды по спасению мира» и ее привлечение в случае критичного инцидента.
  • Покажем, как у нас происходит ведение инцидента и информирование по нему: регистрация, приоритизация, оповещение. Как нам во всем этом помогают наши собственные разработки (Jarvis bot, Status Page).
  • Метрики успеха для инженеров мониторинга: скорость и качество.
  • Покажем интеграцию, которая сильно облегчает постмортем инцидентов.
Дарья Попова

Купер.тех

Более 10 лет работает в IT. Начинала специалистом технической поддержки, сейчас работает тимлидом группы мониторинга. Работает в Купере больше трех лет, руководит командой мониторинга. Строят процессы, метрики, инструменты для обнаружения, ведения и устранения инцидентов.

Алексей Глотов

Купер.тех

Больше 10 лет в IT. Начинал инженером технической поддержки, а через время дорос до руководителя команды и далее до руководителя направления в компании.
Через время увлекся разработкой и ушел из поддержки. На текущий момент руководит небольшой командой разработки автоматизаций процессов мониторинга.

Видео