Как велосипеды уменьшают MTTR? Как использовать LLM в инцидентах
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Во время инцидентов в больших распределенных системах с микросервисной архитектурой часто возникает проблема поиска логов/метрик/алертов etc этих микросервисов. Неэффективный поиск по многообразным ресурсам приводит к увеличению MTTR/MTTRC.
Стандартный тулинг не всегда заточен под эффективный поиск и быструю починку инцидентов. Решением данной проблемы может стать кастомный инструмент.
Старший разработчик в команде надежности Такси.
Координирует инциденты, вместе с командой занимался внедрением Chaos Engineering, а сейчас техлид проекта Virtual Orders (интеграционное нагрузочное тестирование).
-
Видео
Другие доклады секции
DevOps практики и культура