🏋🏻‍♂️Семплирование трейсов изнутри. Что скрывается под вершиной айсберга?

Наблюдаемость и Operational intelligence

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Этот доклад будет полезен тем, кто хочет более детально разобраться в механизмах обработки трейсов, как они обрабатываются под нагрузкой и какие подводные камни могут возникнуть в процессе.

Целевая аудитория

Инженеры эксплуатации, DevOps, SRE.

Тезисы

В докладе мы разберём, что такое распределенный трейс, из чего он состоит и как собрать все его части воедино, чтобы получить цельное представление о запросе. Обсудим, почему сбор и хранение всех трейсов не всегда оправданы и как семплирование помогает снизить нагрузку на систему без потери ключевой информации. Рассмотрим два основных подхода — head-based- и tail-based-семплирование, разберём их принципы работы, алгоритмы реализации, преимущества и ограничения.

Отдельное внимание уделим масштабированию: почему при увеличении нагрузки нельзя «просто добавить серверов» в бэкенд мониторинга, какие проблемы возникают при объединении фрагментов трейсов и как принимать решения о семплировании в условиях неполного контекста. Завершим доклад разбором архитектур решений для масштабирования семплирующего бэкенда и примеров их реализации в реальных системах мониторинга.

Технический директор GMonit.

GMonit

Observability-платформа GMonit — полностью российское решение, базирующееся на лучших мировых практиках, предназначенное для повышения прозрачности информационных систем для разработчиков и бизнеса. Замещает зарубежное программное обеспечение для мониторинга: AppDynamics, Dynatrace, New Relic и др.

Видео