От нуля до GPUaaS
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Развертывание и управление кластером Kubernetes с поддержкой GPU в изолированном контуре — это вызов, особенно когда нужно обеспечить низкие задержки InfiniBand и изоляцию для множества команд.
Мы расскажем, как решили эту задачу, построив полностью автоматизированный стек на базе операторов. Вы увидите, как:
- “GPU и Network Operator” - берут на себя всю сложность настройки драйверов, SR-IOV VF и сетевых партиций (pkey).
- “Автоматизация на основе квот” - предоставляет разработчикам изолированные неймспейсы с гарантированной долей GPU и высокой производительностью сети.
DevOps Engineer. Более двух лет я занимаюсь построением и настройкой GPU кластеров, что стало моей основной областью работы и развития в этом направлении
18 лет в ИТ. Прошел путь от дежурного инженера до руководителя облачных платформ и искусственного интеллекта. Интересуюсь новыми технологиями? практиками применения ИИ в финансовом секторе. Играю на барабанах в группе.
Видео
Другие доклады секции
MLOps, DataOps и Data Engineering