От нуля до GPUaaS
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Развертывание и управление кластером Kubernetes с поддержкой GPU в изолированном контуре — это вызов, особенно когда нужно обеспечить низкие задержки InfiniBand и изоляцию для множества команд.
Мы расскажем, как решили эту задачу, построив полностью автоматизированный стек на базе операторов. Вы увидите, как:
- “GPU и Network Operator” - берут на себя всю сложность настройки драйверов, SR-IOV VF и сетевых партиций (pkey).
- “Автоматизация на основе квот” - предоставляет разработчикам изолированные неймспейсы с гарантированной долей GPU и высокой производительностью сети.
DevOps Engineer. Более двух лет я занимаюсь построением и настройкой GPU кластеров, что стало моей основной областью работы и развития в этом направлении
Видео
Другие доклады секции
MLOps, DataOps и Data Engineering