На чём стоит Performance: многоуровневые гарантии для устойчивых систем
Доклад принят в программу конференции
Целевая аудитория
Тезисы
В системах с тысячами серверов отказы неизбежны: выходят из строя диски, сервера, целые дата-центры, не говоря уже о сбоях ПО.
Эффективное решение подобных проблем требует знаний методологий, инструментов анализа и прикладного слоя.
Но для обеспечения стабильной работы одной реакции на сбои недостаточно — нужны превентивные подходы, устраняющие целые классы проблем.
На докладе обсудим, как создать систему многоуровневых гарантий — от оборудования до контейнеров с приложениями, — чтобы пользователи получали стабильный сервис, независимо от того, где произошел сбой.
Привет! Меня зовут Александр, занимаюсь performance engineering в ecom.tech.
Изучаю все, что связано с внутренней работой linux, сети и рантаймов. Стараюсь перенимать лучшие практики и привносить их в свою повседневную работу.
Регулярно выступаю на внутренних митапах, пишу на golang, C и в блог.
Веду telegram канал "Performance matters!" и занимаюсь менторством 🎒.
ecom.tech
Видео
Другие доклады секции
Reliability Engineering