Мнение Программного комитета о докладе
Вроде нередкая задача, но всегда вызывает боль. Докладчица рассказывает, как минимизировать боль и что стоит использовать.
Доклад принят в программу конференции
Вроде нередкая задача, но всегда вызывает боль. Докладчица рассказывает, как минимизировать боль и что стоит использовать.
В докладе расскажу, как устроен мониторинг в Ozon в целом, и как мы организовали мониторинг CronJob в Kubernetes на базе готовых решений Prometheus-Thanos-Grafana и Kube-state-metrics при наличии давно сформированной инфраструктуры мониторинга. Нашей целью было внедрить новые инструменты с минимальным влиянием на разработчиков, но при этом получить максимум с точки зрения мониторинга.
В результате у нас получился полноценный инструмент мониторинга CronJob, который предоставляет как базовые алерты и агрегации, так и дает возможность репортить свои метрики. Значительно сократили время реагирования на инциденты, где участвуют Сronjob.
Доклад будет наиболее полезен тем, кто развивает инфраструктуру мониторинга, кто эксплуатирует большое количество CronJob в Kubernetes, кто давно мечтал собирать метрики с CronJob.
Разработчик в платформе Телеметрии, специализируется на мониторинге. Помогает разработчикам следить и наблюдать за своими сервисами.
Ozon
Видео, доступные к покупке
Видео FrontendConf 2022
7 и 8 ноября 2022
22750 ₽
Видео HighLoad++ 2022
24 и 25 ноября 2022
22750 ₽
Видео HighLoad++ Armenia 2022
15 и 16 декабря 2022
22750 ₽
Видео TeamLead Conf 2023
27 и 28 февраля 2023
22750 ₽
Видео DevOpsConf 2023
13 и 14 марта 2023
22750 ₽