Постмортемы для багов или почему проведение постмортема может быть необходимым, даже для ошибки, не повлекшей серьёзной аварии
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Постмортем-анализ традиционно применяется для значительных инцидентов, однако методы и культуру этого подхода стоит распространять также на баги. Это позволяет вовремя выявлять и устранять системные проблемы до их трансформации в масштабные аварии. В своем докладе я расскажу, как использование постмортемов для анализа багов способствует созданию психологически безопасной среды и позволяет фокусироваться на решении системных технологических проблем. Мы обсудим методики определения критичности багов, нашу собственную методику их ранжирования, а также поделимся достигнутыми результатами и примерами из практики.
10 лет в Телекоме. Прошёл путь от инженера мониторинга до SRE продукта. Принимал участие в проектах по разработке и внедрению сервисного каталога системы провижининга в Беларуси и России. В настоящее время занимается разработкой и внедрением процессов улучшения надёжности и безотказности одного из продуктов новой разрабатываемой платформы МТС Web Services (MWS).
Видео
Другие доклады секции
Инциденты и постмортемы