Конференция завершена. Ждем вас на DevOpsConf в следующий раз!

Мониторинг SLA микросервисов без регистраций и СМС

SRE-практики

Логирование и мониторинг
Observability в enterprise
Логи, метрики, ошибки
Автоматизация разработки, доставки, эксплуатации
Микросервисы
Метрики

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Доклад о том, как можно реализовать описание самих SLA в виде кода, а также как, исходя из таких SLA-as-code, автоматически строить дашборды и алерты.

Целевая аудитория

Разработчики, DevOps-инженеры, техлиды команд.

Тезисы

"Ваш сервис работает медленно и с ошибками!" Как часто приходилось такое слышать? А что такое медленно и какое количество ошибок считать допустимым? А главное, как узнавать о проблемах раньше, чем пользователи? В таких случаях вспоминают про SLA и фиксируют для других и самих себя требования к работе сервиса.

У нас было несколько команд разработки, большой объем критичных для компании задач, сжатые сроки для их реализации, много новых микросервисов и старого легаси, команда SRE, которой нужно всё это поддерживать, и платформенная команда, которая попыталась реализовать решение для мониторинга SLA микросервисов с минимальными отвлечениями на это всех остальных команд. На выходе получили оповещения о нарушениях SLA "из коробки" и много пунктов для дальнейших улучшений.

Дмитрий Куянов

Райффайзен Банк

Больше 10 лет в IT. Студентом-стажёром помогал писать софт для NYSE, много лет позже участвовал в переносе зарплатных процессов банка из монолита в свои микросервисы. Писал код на .NET, читал на Java, ускорял тестирование в команде. Сейчас техлид в одной из команд в самом сердце банка.

Райффайзен Банк

Райффайзен Банк — часть австрийской банковской группы Raiffeisen Bank International; работает в России с 1996 года и входит в тройку самых надежных российских банков по версии Forbes. В команде банка более 3000 IT-специалистов, которые работают над продуктами будущего и развивают финтех в России. И не любят легаси.

Видео