Конференция завершена. Ждем вас на DevOpsConf в следующий раз!

Chaos Engineering, от первой атаки до создания команды

Опыт внедрения инженерных практик

Отказоустойчивость
Devops / другое
Надёжность продакшена
DevOps / SRE
Типовые ошибки

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Мечтаете протестировать ИТ-инфраструктуру на готовность к внезапным отказам?! Да и еще и организовать из этого процесс?! Тогда вам сюда!

Целевая аудитория

Разработчики разного уровня, администраторы, DevOps-инженеры, SRE, тимлиды, техлиды.

Тезисы

В докладе мы поделимся реальным опытом использования техник Chaos Engineering в различных современных и legacy-проектах, расскажем о проблемах, с которыми сталкивались, покажем, как их обойти, и подтвердим и развеем мифы о надежности систем. Проведем слушателя от первой атаки до создания Chaos Engineering-команды. Покажем на примерах реальные проблемы, "которые никогда не наступят", и как с помощью Chaos Engineering можно было бы к ним подготовиться и понимать, как поведет себя ваша система в различных турбулентных сценариях от просроченных сертификатов до split-brain между кластерами.

RnD-архитектор, техлид. Разрабатывал различные распределенные системы, системы принятия решений на основе AI. Chaos Engineering is fun 🙂

МТС

МТС — современная экосистема цифровых сервисов и ведущий телеком-оператор в России. IT-команда компании из более чем 8 000 специалистов реализует передовые технологичные решения внутри экосистемы, обеспечивая поддержку таких направлений, как финтех, Big Data, облачные сервисы, IoT, MTS AI и других.

Создал команду Chaos Engineering в розничном блоке, успешно проводит атаки на различные системы и улучшает уровень отказоустойчивости систем. Также имеет большой опыт в банковском ПО, участник программы централизации и др.

Сбер

Сбер — это современный стек технологий, драйвовые проекты и команда единомышленников. У нас около 3 000 продуктовых команд и огромное профессиональное IT-сообщество. Мы работаем над созданием удобных онлайн-сервисов в самых разных сферах.

Видео

Подготовительное задание
На мастер-классе мы проведем различные типы атак на "игрушечном", но архитектурно вполне взрослом приложении. Для этого вам понадобится к себе на ноутбук установить docker, docker-compose и перед мастер-классом необходимо скачать docker-compose.yml-файл, запустить и убедиться, что все работает, вызвав localhost:8080/healthcheck.
Также будет круто, если вы изучите несколько статей в интернете:
https://github.com/dream-x/workshop_techlead