От нуля до GPUaaS

MLOps, DataOps и Data Engineering

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

DevOps Engineer, MlOps и все, кто интересуется GPU

Тезисы

Развертывание и управление кластером Kubernetes с поддержкой GPU в изолированном контуре — это вызов, особенно когда нужно обеспечить низкие задержки InfiniBand и изоляцию для множества команд.
Мы расскажем, как решили эту задачу, построив полностью автоматизированный стек на базе операторов. Вы увидите, как:

- “GPU и Network Operator” - берут на себя всю сложность настройки драйверов, SR-IOV VF и сетевых партиций (pkey).

- “Автоматизация на основе квот” - предоставляет разработчикам изолированные неймспейсы с гарантированной долей GPU и высокой производительностью сети.

Евгений Шубин

Альфа Банк

DevOps Engineer. Более двух лет я занимаюсь построением и настройкой GPU кластеров, что стало моей основной областью работы и развития в этом направлении

18 лет в ИТ. Прошел путь от дежурного инженера до руководителя облачных платформ и искусственного интеллекта. Интересуюсь новыми технологиями? практиками применения ИИ в финансовом секторе. Играю на барабанах в группе.

Видео