Этот доклад для всех, кто хочет послушать историю полную как боли и лишений, так и инженерного опыта. Поговорим о том, как подходить к масштабным задачам, где подстелить соломки и как убедиться, что все будет работать даже при отключении дата-центра.
Расскажу:
* как мы включали авторизацию на кластере, переваривающем 17 млн сообщений в секунду;
* Strimzi-провайдер — продакшн-решение без логов и метрик;
* разделение авторизации и аутентификации — добро или зло?
* проблемы со стороны клиентов — как расследовать и откуда они берутся?
* как потери единичных пакетов дестабилизируют всю систему и что с этим делать;
* как организовать переход нескольких тысяч микросервисов на четырех языках на походы в кафку с авторизацией.