🌱Свое или чужое: почему и как мы делаем нашу хаос-платформу

Chaos engineering

Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
DevOps / Кубер
DevOps / SRE
Инфраструктура

Доклад принят в программу конференции

Мнение Программного комитета о докладе

В 2024 году была создана собственная платформа для хаос-тестирования, чтобы устранить ограничения существующих инструментов. В докладе эксперт расскажет, почему был выбран этот путь, как на это отреагировали команды, каких результатов удалось достичь и какие есть планы по развитию платформы.

Целевая аудитория

Разработчики, платформенные инженеры, SRE, техлиды, тимлиды, CEO, CTO.

Тезисы

В банке мы постоянно проводим Disaster Recovery Test. Если по-простому, мы проверяем уровень отказоустойчивости наших продуктов. Однако делать это все вручную сложно и трудоемко. В связи с этим мы начали искать решения для автоматизации таких тестов. Мы не смогли найти подходящих инструментов, поэтому начали писать своё решение.

Я хочу рассказать вам о том, как мы собрали требования, собрали команду, начали писать, а потом переписывать, и что нас не устроило в существующих решениях.

Кирилл Пономарев

Райффайзен Банк

Руководитель направления по развитию платформ разработки Chaos Platform. Участник внутреннего DevOps-сообщества. Евангелист хаос-инжиниринга в банке. В IT уже давно, а в банке — более 2 лет.

Райффайзен Банк

Райффайзен Банк работает в России с 1996 г. и входит в тройку самых надежных российских банков по версии Forbes. В Райфе более 3000 IT-специалистов развивают финтех в России и создают качественные и удобные сервисы для людей и бизнеса. И не любят легаси.

Видео