D&D: Observability надёжности

Воркшопы

Доклад принят в программу конференции

Целевая аудитория

Разработчикам — чтобы посмотреть, как их сервис может влиять на систему в целом и отражаться на общих метриках. Научимся собирать исторические данные и использовать их. SRE — разберем целостный взгляд на сервис и систематические подходы к улучшению надежности. Платформенным инженерам — оценим вклад инфраструктуры и возможности для качественных улучшений.

Тезисы

Приглашаем на интерактивный воркшоп-приключение, в котором мы поговорим о надежности в крупных микросервисных системах.
Мы собрали v-team опытных инженеров (то есть, вас) чтобы улучшить надёжность создания заказов в одном известном приложении заказа еды (маркетплейсе, банке, выберите свой вариант).
Главное для клиента сервиса — получить нужную ему услугу. Поэтому вы зашли почитать трейсы и построили по ним карту зависимостей между сервисами при ключевом сценарии работы.
У разных сервисов есть разного качества документация, но в её актуальности нет уверенности, поэтому критичность и надёжность вам предстоит узнавать на практике. Ваша конечная цель — повысить доступность метода POST /order.

Кому и зачем стоит приходить
Разработчикам — чтобы посмотреть, как их сервис может влиять на систему в целом и отражаться на общих метриках. Научимся собирать исторические данные и использовать их.
SRE — разберем целостный взгляд на сервис и систематические подходы к улучшению надежности.
Платформенным инженерам — оценим вклад инфраструктуры и возможности для качественных улучшений.

Последние 14 лет Вадим провел в IТ. Проектировал и разрабатывал распределенные системы, масштабировал сервисы под нагрузку, управлял командами, проектами и процессами. Сейчас занимается надежностью и устойчивостью систем.

Любит Канбан, коммуникации и Kafka. В свободное время организует митапы и конференции для Ростовского IТ-сообщества RndTech, преподает студентам и выступает как спикер.

Видео