Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации

Интерпретация данных мониторинга на базе TSDB: ключевые ошибки и решения на примере Prometheus

Наблюдаемость и Operational intelligence

Логирование и мониторинг
Devops / другое
DevOps и аутсорсинг
Observability в enterprise
Логи, метрики, ошибки
DevOps / Кубер
DevOps / SRE

Доклад принят в программу конференции

Целевая аудитория

Данный доклад будет полезен как инженерам, занимающимся эксплуатацией, так и инженерам-разработчикам, поскольку он позволит лучше понять принципы работы Prometheus и использовать его более эффективно.

Тезисы

Как и в фильме «Матрица», реальность не всегда такова, какой кажется. Данные систем мониторинга могут создавать миражи, которым мы доверяем без лишних сомнений. В докладе рассмотрим, что на самом деле скрывается за графиками и как не поддаться «иллюзиям», которые они могут создавать.

В первой части обсудим, почему визуализированные метрики могут дать искажённое представление о реальности. Как и в «Матрице», данные — это не объективная истина, а интерпретация, которая зависит от множества факторов. Наш анализ покажет, что проблема "ложныхметрик" — не в технической ошибке, а в особенностях их представления и восприятия.

Затем мы погрузимся глубже — в архитектурные особенности систем мониторинга на примере Prometheus. Как и Нео, который осознал, что мир «Матрицы» — это симуляция, мы разберёмся, как происходит чтение в Prometheus.

В заключении поговорим о том, как «проснуться» и начать воспринимать метрики систем мониторинга правильно. А также разберём особенности, которые надо учитывать, чтобы не попадать в ловушки ложного восприятия.

Владимир Гурьянов, Technical product manager Deckhouse Observability Platform

Иженер, тимлид и архитектор с 15-летним стажем. В институте учился на разработчика, но не срослось — ушел в эксплуатацию. С тех пор изучает Linux. Читает и пишет на Go со словарем, дружит с Python. Имеет сертификат Certified Kubernetes Administrator, но признается, что не понял, зачем он нужен. Последние время основным направлением является Observability, чем и занимается в Deckhouse. Пожизненно состоит в кружках «Хочу все знать» и «Всегда готов поделиться тем, что уже узнал».

Флант

Deckhouse — это продуктовое направление компании «Флант». Мы развиваем ведущую Kubernetes-платформу в России и набор Cloud Native-инструментов для виртуализации, мониторинга, хранения секретов, управления версиями кода и парком кластеров. Наши продукты упрощают разработку, доставку и эксплуатацию приложений. С 2017 года их успешно внедрили больше 240 компаний из разных отраслей. В нашей команде десятки Certified Kubernetes Administrators. А ещё мы — № 1 контрибьютор Kubernetes из России.

Видео