От нуля до GPUaaS
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Развертывание и управление кластером Kubernetes с поддержкой GPU в изолированном контуре — это вызов, особенно когда нужно обеспечить низкие задержки InfiniBand и изоляцию для множества команд.
Мы расскажем, как решили эту задачу, построив полностью автоматизированный стек на базе операторов.
Вы увидите, как: * «GPU и Network Operator» берут на себя всю сложность настройки драйверов, SR-IOV VF и сетевых партиций (pkey); * «Автоматизация на основе квот» предоставляет разработчикам изолированные неймспейсы с гарантированной долей GPU и высокой производительностью сети.
DevOps Engineer. Более двух лет занимается построением и настройкой GPU-кластеров, что стало его основной областью работы и развития в этом направлении.
Видео
Другие доклады секции
MLOps, DataOps и Data Engineering