Как мы приручали хаос логов: ML-кластеризация на пути от сырых событий к инцидентам

Инциденты и постмортемы

Логирование и мониторинг
Devops / другое
Управление инцидентами
Логи, метрики, ошибки
DevOps / SRE

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Devops, SRE, IT-директора, Руководители центров мониторинга

Тезисы

Мы покажем, как двухуровневая ML-кластеризация логов превращает поток сырых событий из Zabbix, Prometheus и других систем мониторинга в структурированные инциденты, снижая шум и давая наглядную картину для анализа с возможностью провалиться до конкретных событий.

7 лет в Айти, руководитель продукта Artimate

Видео