Как велосипеды уменьшают MTTR? Как использовать LLM в инцидентах

DevOps практики и культура

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

SRE-инженеры, разработчики, тех-менеджеры

Тезисы

Во время инцидентов в больших распределенных системах с микросервисной архитектурой часто возникает проблема поиска логов/метрик/алертов etc этих микросервисов. Неэффективный поиск по многообразным ресурсам приводит к увеличению MTTR/MTTRC.

Стандартный тулинг не всегда заточен под эффективный поиск и быструю починку инцидентов. Решением данной проблемы может стать кастомный инструмент.

Старший разработчик в команде надежности Такси.
Координирует инциденты, вместе с командой занимался внедрением Chaos Engineering, а сейчас техлид проекта Virtual Orders (интеграционное нагрузочное тестирование).

Видео

Другие доклады секции

DevOps практики и культура

Мой тех.дир - cамодур!
Юлия Жерносек

Выгоревший Безработный