Конференция для инженеров и всех, кто должен понимать инженеров

Синтетическая телеметрия: Как улучшить MTTR с помощью композитных метрик Здоровья сервисов и использования ML алгоритмов

Актуальные практики инженеров эксплуатации

Доклад отозван

Мнение Программного комитета о докладе

Доклад поднимает вопросы того, как эффективно выбирать приоритетные метрики для выявления проблем, представленных с разных сервисов, а также использование композитных метрик здоровья сервисов, объединяющих несколько сигналов в одной метрике для оценки состояния системы и все это приправлено ML!

Целевая аудитория

DevOps инженеры

Тезисы

Когда у вас сотни сервисов, тысячи уникальных метрик с каждого сервиса, то встает вопрос - на какие метрики стоит обращать внимание в первую очередь, чтобы понять, что чинить. Я расскажу, как мы используем композитные метрики Здоровья сервисов, агрегирующие несколько сигналов в одной метрике, и как применяем ML алгоритмы для выявления трендов в распределении значений метрик Здоровья.

Более 11 лет работаю в области информационных технологий и разработке.
5 лет назад присоединился к команде Proto в качестве DevOps инженера. Сейчас директор по эксплуатации и сооснователь Proto Observability Platform. Отвечаю за эксплуатацию, масштабирование и бесперебойную работу платформы, непосредственно участвую в разработке.

Proto Group

Мы - разработчик Proto Observability Platform - первой российской full stack observability платформы, и сервис-провайдер c более 10 лет опытом выполнения проектов по цифровой трансформации, кибербезопасности, облачным вычислениям, разработке программных продуктов на основе стека современных технологий.

Видео