Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

История хаоса в Такси

Chaos engineering

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Андрей расскажет, как хаос-тестирование помогает выявлять уязвимости и повышать надежность систем. На примере сервиса Такси он покажет интеграцию Chaos Engineering в Incident Management, поделится успешными кейсами, советами и реальными результатами.

Целевая аудитория

Инженеры, лиды, SRE

Тезисы

Что такое хаос? Когда и почему стоит его делать? Есть ли готовые решения, которые можно взять и использовать или стоит написать свое?

Расскажу про подход на масштабе Яндекса.
Как мы чуть не развалили продакшен при внедрении, факапы с учений, чему мы научились и главные выводы.

Спойлер: Мы ломаем сервисы в продакшене на 100% пользовательского трафика.
Слабоумие и отвага? Узнаем в докладе :)

Старший разработчик в команде надежности Такси.
Координирую инциденты, вместе с командой занимался внедрением Chaos Engineering, а сейчас техлид проекта Virtual Orders (интеграционное нагрузочное тестирование)

Яндекс

TBD

Видео