Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

DRP для динамического ландшафта финтеха - опыт Т-Банка

DevOps практики и культура

Отказоустойчивость
Распределенные системы
Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
Менеджмент в эксплуатации
Управление изменениями
Надёжность продакшена
Микросервисы
DevOps / SRE

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

SRE, DevOps, архитекторы у которых отзывается тема восстановления систем при авариях

Тезисы

Как свести к минимуму негативное влияние возможных аварий на работу крупного финтеха?
Как построить процесс подготовки и поддержки актуальных планов DR для динамических ландшафтов?

Расскажем наш подход:
- итеративное создание DRP - от частных планов систем к общему плану бизнес-услуги
- чеклист анализа системы и создание плана восстановления
- ключевое - восстановление основной функциональности, точка готовности системы
- общий план восстановления бизнес-услуги и работа с зависимостями
- планы требуют учений (бумажных и реальных)
- изменяем архитектуру систем / услуг
- доопределяем риски, их источники и признаки их реализации
- выравниваемся с требованиями регуляторов
- услуги и системы динамически изменяются - внедряем гигиену SRE команд по поддержке планов в актуальном состоянии

Отвечаю за технологическую независимости ИТ инфраструктуры. Вместе с несколькими десятками ИТ команд развиваем ключевые информационные системы Банка.
Построил крупнейшее по выручке в России коммерческое облако. Учился в Бауманке, закончил ГУУ, преподавал облачные технологии в магистратуре ФизТеха.

Т-Банк

Банк без отделений и очередей, использующий самые современные технологии. Мы создаем и развиваем десятки высоконагруженных сервисов, делаем лучше и проще жизнь 40+ млн наших клиентов.

Видео

Другие доклады секции

DevOps практики и культура