Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

Катастрофоустойчивость для ВКС. Как мы реализовывали георезервирование для “стартапа”.

Reliability Engineering

Отказоустойчивость
Распределенные системы
Масштабирование с нуля
Архитектуры / другое
Надёжность продакшена
DevOps / SRE
Инфраструктура

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Архитекторы, которые планируют внедрять и инженеры, которые поддерживают геораспределенную инфраструктуру.

Тезисы

Три года мы помогаем сопровождать продукт российской ВКС одному из наших заказчиков. Мы прошли тернистый путь от стартапа “прод на коленке за две недели” и каждый день “ложились в прайм тайм” до геораспределенного по трем ЦОДам конкурентного продукта.

Наш рассказ будет о боли, которая испытывалась все это время, о том, как мы “придумывали заново” каждое популярное решение и через “нетиповые” решения приходили к типовым. Как боролись с проблемами инфраструктуры за пределами нашей зоны ответственности, и как нам в этом помогали разработчики.

Из продукта, к которому не было доверия на старте, мы стали бизнес критичной системой, с подтвержденным уровнем доступности 99.99% в 2023 году.

В IT 20 лет от дежурного инженера до архитектора решений.
Системный администратор 10+
Эксперт\Архитектор 6+
Набирался опыта в Яндексе и Яндекс.Деньги в начале карьеры, чтобы потом его принести в другие компании.

К2 Cloud

Интегратор

Более 15 лет в ИТ, прошел путь от ассистента сисадмина до ведущего системного администратора. В своих проектах использует методологию DevOps, работает с частными и публичными облаками, активно использует подход Infrastructure as a Code, с помощью Terraform и Ansible. Для автоматизации рутинных операций использует Bash или Python. В среде контейнеризации получил сертификат Certified Kubernetes Administrator.

КРОК

Технологический партнер с комплексной экспертизой в области построения и развития инфраструктуры, внедрения информационных систем, разработки программных решений и сервисной поддержки. КРОК реализует проекты, которые задают тон индустрии: от крупнейшего ЦОДа в стране до «умной» инфраструктуры спортивных объектов.

Видео

Другие доклады секции

Reliability Engineering