Делаем жизнь ML-инженеров проще: как мы построили систему Remote IDE на on-premise ресурсах
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
В Т-Банке мы активно развиваем **ML Core** — нашу собственную ML-платформу на базе Kubernetes, где всё взаимодействие скрыто за простым и надёжным API. Однако, несмотря на автоматизацию, некоторые команды продолжают активно использовать **dev-тачки с SSH-доступом**: они удобны, гибки и позволяют быстро экспериментировать.
Мы решили предложить альтернативу: **ML Core DevBox** — виртуальную ML-среду "по требованию", которая сочетает удобство dev-тачки и преимущества платформы:
- Полный контроль: GPU, IDE, дебаг - почти как на локальной машине
- Персистентность данных и гибкое управление ресурсами
- Интеграция с внутренними системами
- Безопасность, мониторинг и автоматическое управление жизненным циклом
В докладе я расскажу:
- Почему dev-тачки до сих пор популярны — и какие у них скрытые издержки;
- Как родилась идея DevBox и какие технические и организационные вызовы мы преодолели;
- Как устроена архитектура: от кастомного 'devbox-agent' до автоматического разогрева хранилищ;
- Как DevBox уже используется в продакшене, какие метрики показывают успех — и что ещё предстоит сделать.
Если ты строишь ML-платформу, поддерживаешь ML-команды или ищешь баланс между свободой разработки и централизованным контролем — будет интересно.
Тимлид команды ML Core Developer Experience, отвечает за Managed JupyterLab и DevExp в ML-платформе Т-Банка. До Т-Банка работал в Lamoda в команде маркетинговых инструментов и внутреннего Golang-туллинга.
Увлекается веб-разработкой на Golang и Python, интересуется другими языками. Изучает и применяет различные архитектурные паттерны. Любит писать понятный код, который решает задачу, или не писать его вообще.
Ведет телеграм-канал t.me/one_engineer_notes
Видео
Другие доклады секции
Platform Engineering. Архитектура платформ