Катастрофоустойчивость для ВКС. Как мы реализовывали георезервирование для “стартапа”.
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Три года мы помогаем сопровождать продукт российской ВКС одному из наших заказчиков. Мы прошли тернистый путь от стартапа “прод на коленке за две недели” и каждый день “ложились в прайм тайм” до геораспределенного по трем ЦОДам конкурентного продукта.
Наш рассказ будет о боли, которая испытывалась все это время, о том, как мы “придумывали заново” каждое популярное решение и через “нетиповые” решения приходили к типовым. Как боролись с проблемами инфраструктуры за пределами нашей зоны ответственности, и как нам в этом помогали разработчики.
Из продукта, к которому не было доверия на старте, мы стали бизнес критичной системой, с подтвержденным уровнем доступности 99.99% в 2023 году.
В IT 20 лет от дежурного инженера до архитектора решений.
Системный администратор 10+
Эксперт\Архитектор 6+
Набирался опыта в Яндексе и Яндекс.Деньги в начале карьеры, чтобы потом его принести в другие компании.
К2 Cloud
Более 15 лет в ИТ, прошел путь от ассистента сисадмина до ведущего системного администратора. В своих проектах использует методологию DevOps, работает с частными и публичными облаками, активно использует подход Infrastructure as a Code, с помощью Terraform и Ansible. Для автоматизации рутинных операций использует Bash или Python. В среде контейнеризации получил сертификат Certified Kubernetes Administrator.
КРОК
Видео
Другие доклады секции
Reliability Engineering