Мнение Программного комитета о докладе
Хардкорный рассказ про сложности обработки большого количества данных (150 Тб в сутки) и новые инструменты — dagster, arrow и polars, volcano.
4 и 5 марта 2024
Москва, Кампус СКОЛКОВОДоклад принят в программу конференции
Хардкорный рассказ про сложности обработки большого количества данных (150 Тб в сутки) и новые инструменты — dagster, arrow и polars, volcano.
Self-driving-разработчикам необходимо иметь возможность легко и оперативно получать обработанные данные с проездов беспилотных автомобилей для развития технологии и решения множества разнообразных повседневных задач: вычисления метрик проездов, определения качества доработок, получения датасетов для обучения моделей, построения HD-карты, разметки целевых ситуаций с проездов и пр.
Перед нами была поставлена задача разработать пайплайны обработки и автоматической разметки логов проездов беспилотных автомобилей и предоставить удобные инструменты для доступа к этим данным.
Из доклада вы узнаете:
* как мы научились обрабатывать большой объем сериализованных данных с беспилотных автомобилей (130-150 Tb в сутки);
* какой Open Source-стек мы для этого выбрали;
* почему отказались от Apache Airflow и остановились на Dagster;
* где и как мы запускаем вычисления на Spark, а где обходимся Apache Arrow и Polars;
* чем нас не устроил стандартный планировщик Kubernetes, и чем мы его заменили (спойлер: Volcano);
* как мы реализовали автоматическую эволюцию схем табличных данных в Spark + Hive Metastore.
Руководитель команды регламентной обработки и визуализации данных SberAutoTech. 5 лет занимается обработкой данных и созданием удобных хранилищ. Старается автоматизировать все и вся, чтобы ночью можно было просто спать.
В свободное время любит делать что-нибудь руками, программировать всякие интересные штуки на ардуино, калибровать 3D-принтер, читать книги и следить за миром обработки данных и ML.
Закончил Т факультет НИЯУ МИФИ на инженера-физика по проектированию АЭС. Ранее работал в МТС BigData и SberDevices, строил хранилища, автоматизировал процессы обработки данных и разрабатывал предиктивные модели.
Гордится тем, что постоянно пробует и реализует что-то новое, о чем раньше даже не думал, и это вроде даже получается, и тем, что никогда не стоит на месте.
ООО "Автотех"
Руководитель инфраструктурной DevOps-команды в SberAutoTech, до этого занимался DevOps в SberInfra и строил небольшие публичные облака.
SberAutoTech
Big Data и Data Engineering
Конференция для инженеров и всех, кто должен понимать инженеров
Варианты участия
Офлайн-участие
Стоимость конференции постоянно растет — чем ближе к мероприятию, тем дороже.
Текущая стоимость билета — 75000 ₽
Онлайн-участие
Все потоки с докладами (но не потоки с митапами) будут транслироваться нами онлайн.
Текущая стоимость билета — 37500 ₽
Корпоративное участие (от 10 билетов)
Для заказа от 10 билетов на очное или онлайн-участие, свяжитесь с нами по partners@ontico.ru.
Передумали покупать?
Расскажите, почему
Благодарим вас за ответ!
Видео, доступные к покупке
Видео FrontendConf 2023
2 октября 2023 — 3 ноября 2023
32000 ₽
Видео HighLoad++ 2023
27 и 28 ноября 2023
32000 ₽
Видео TeamLead Conf++ 2023
30 ноября 2023 и 1 декабря 2023
32000 ₽
Видео DevOpsConf 2024
4 и 5 марта 2024
37500 ₽
Видео Saint HighLoad++ 2024
24 и 25 июня 2024
39500 ₽
Видео Saint TeamLead Conf 2024
27 и 28 июня 2024
37500 ₽
Видео AiConf 2024
26 и 27 сентября 2024
37500 ₽
Видео FrontendConf 2024
30 сентября 2024 и 1 октября 2024
37500 ₽
Видео Industrial++ 2024
21 и 22 октября 2024
37500 ₽
Конференция для инженеров и всех, кто должен понимать инженеров