D&D: Observability надёжности
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Приглашаем на интерактивный воркшоп-приключение, в котором мы поговорим о надежности в крупных микросервисных системах.
Мы собрали v-team опытных инженеров (то есть, вас) чтобы улучшить надёжность создания заказов в одном известном приложении заказа еды (маркетплейсе, банке, выберите свой вариант).
Главное для клиента сервиса — получить нужную ему услугу. Поэтому вы зашли почитать трейсы и построили по ним карту зависимостей между сервисами при ключевом сценарии работы.
У разных сервисов есть разного качества документация, но в её актуальности нет уверенности, поэтому критичность и надёжность вам предстоит узнавать на практике. Ваша конечная цель — повысить доступность метода POST /order.
Кому и зачем стоит приходить
Разработчикам — чтобы посмотреть, как их сервис может влиять на систему в целом и отражаться на общих метриках. Научимся собирать исторические данные и использовать их.
SRE — разберем целостный взгляд на сервис и систематические подходы к улучшению надежности.
Платформенным инженерам — оценим вклад инфраструктуры и возможности для качественных улучшений.
Последние 14 лет Вадим провел в IТ. Проектировал и разрабатывал распределенные системы, масштабировал сервисы под нагрузку, управлял командами, проектами и процессами. Сейчас занимается надежностью и устойчивостью систем.
Любит Канбан, коммуникации и Kafka. В свободное время организует митапы и конференции для Ростовского IТ-сообщества RndTech, преподает студентам и выступает как спикер.
Видео
Другие доклады секции
Воркшопы