Как заменить всю инфраструктуру и начать спать спокойноDevOps-трансформация
В разработке с 2004 года, в 2018-2024 находился на позициях CTO (2 года в русском EdTech и 5 лет в американском PropTech). Заскучал в программировании и сместил свой технический фокус на SRE/DevOps/InfoSec. Обучался в стартап-акселераторах, сейчас являюсь сертифицированным стартап-трекером и учусь на MBA.
Бывают такие ситуации, когда ты приходишь руководить в проект, который поднимали с нуля разработчики без сильных навыков DevOps. Никто не знает, где находятся серверы, как они настроены, у кого спрашивать пароли, что с бэкапами. У вас есть только доступ к SSH к нескольким серверам с аптаймом больше года, на которых критические сервисы не добавлены в автозагрузку.
Это сага о том, как мы прошли путь от состояния, когда каждый деплой запускался с дрожью в теле до полного спокойствия в случае полного отказа нашего ДЦ. Как мы привели инфраструктуру в порядок и начали хоститься сразу в нескольких дата-центрах, стали делать бэкапы, использовать мониторинг, системы сбора ошибок и так далее.