Почему для SRE важно уметь читать код SRE-практики

Доклад принят в программу конференции
Тезисы

В докладе я расскажу, как умение погружаться в код и отладку сторонних продуктов помогает нам повышать стабильность и находить исходную причину отказов на примере реальных сбоев высоконагруженного сервиса мониторинга с входящим потоком 2,5 Гбайт/сек, использующего Elasticsearch и VictoriaMetrics под капотом.

Максим Ванюшкин
Тинькофф

Бывший разработчик со стажем в 12 лет. Делал и фронт и бэк (Dotnet).
Прошел путь от программиста микроконтроллеров на ассемблере до SRE.
Сейчас SRE-инженер в Sage (Тинькофф).
https://www.linkedin.com/in/max-vanyushkin

Другие доклады секции SRE-практики