Делаем жизнь ML-инженеров проще: как мы построили систему Remote IDE на on-premise ресурсах

Platform Engineering. Архитектура платформ

Бэкенд
Архитектуры, теория программирования
GO
ML
DevOps / Кубер
Безопасность инфраструктуры

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Разработчики, архитекторы, инфраструктурные инженеры и все кто занимаются построением платформ.

Тезисы

В Т-Банке мы активно развиваем **ML Core** — нашу собственную ML-платформу на базе Kubernetes, где всё взаимодействие скрыто за простым и надёжным API. Однако, несмотря на автоматизацию, некоторые команды продолжают активно использовать **dev-тачки с SSH-доступом**: они удобны, гибки и позволяют быстро экспериментировать.

Мы решили предложить альтернативу: **ML Core DevBox** — виртуальную ML-среду "по требованию", которая сочетает удобство dev-тачки и преимущества платформы:
- Полный контроль: GPU, IDE, дебаг - почти как на локальной машине
- Персистентность данных и гибкое управление ресурсами
- Интеграция с внутренними системами
- Безопасность, мониторинг и автоматическое управление жизненным циклом

В докладе я расскажу:
- Почему dev-тачки до сих пор популярны — и какие у них скрытые издержки;
- Как родилась идея DevBox и какие технические и организационные вызовы мы преодолели;
- Как устроена архитектура: от кастомного 'devbox-agent' до автоматического разогрева хранилищ;
- Как DevBox уже используется в продакшене, какие метрики показывают успех — и что ещё предстоит сделать.

Если ты строишь ML-платформу, поддерживаешь ML-команды или ищешь баланс между свободой разработки и централизованным контролем — будет интересно.

Тимлид команды ML Core Developer Experience, отвечает за Managed JupyterLab и DevExp в ML-платформе Т-Банка. До Т-Банка работал в Lamoda в команде маркетинговых инструментов и внутреннего Golang-туллинга.

Увлекается веб-разработкой на Golang и Python, интересуется другими языками. Изучает и применяет различные архитектурные паттерны. Любит писать понятный код, который решает задачу, или не писать его вообще.

Ведет телеграм-канал t.me/one_engineer_notes

Видео

Другие доклады секции

Platform Engineering. Архитектура платформ