Старший разработчик в команду ML-планера робота доставки (RL)

Каждый день роботы доставки Яндекса возят еду и посылки по улицам городов России.

Наша задача — разрабатывать продвинутые модели планирования и прогнозирования траекторий, которые обучаются на миллиардах шагов симуляции и успешно переносятся в продакшн.

Наша команда занимается созданием и улучшением RL-планера, который ежедневно принимает миллионы решений на дорогах и тротуарах. Мы активно экспериментируем с передовыми подходами в Reinforcement Learning и трансформерными архитектурами, используем мощный GPU-симулятор, а также постоянно ищем новые подходы к обучению моделей и улучшению их качества.

Хотите создавать алгоритмы, которые помогают роботам доставки безопасно и эффективно передвигаться в реальном мире? Присоединяйтесь, чтобы ваш код управлял движением роботов, которых вы видите на улицах!

Задачи и обязанности

Поиск и интеграция новых подходов к обучению RL-планера

Вам нужно будет исследовать современные методы RL и их модификации (PPO, GRPO, TD-λ и другие), прототипировать новые алгоритмы, настраивать reward-функции и сценарии обучения. Ваша задача — превратить идеи из статей и экспериментов в устойчивый продакшн-пайплайн.

Развитие архитектур трансформерных моделей планирования

Вам предстоит проектировать и внедрять новые модули в модели на базе Wayformer- и MotionLM-подходов. Вы будете отвечать за качество модели, стабильность обучения и интерпретируемость поведения модели.

Разработка и расширение сценариев симуляции

В составе команды вы будете придумывать новые сложные сцены для GPU-симулятора. Цель — закрыть sim-to-real gap и сделать планер максимально устойчивым к неожиданным ситуациям в городе.

Больше об ML в Яндексе — в канале Yandex for ML

Требования

Уверенно знаете Python и PyTorch
Понимаете основы Reinforcement Learning и трансформерных моделей
Готовы изучать сложные подходы и решать нетривиальные задачи

Дополнительные требования

Работали с RL, Motion Planning или трансформерами
Обладаете знаниями в области робототехники и симуляции
Имеете опыт работы с C++, ROS, TRT, Cuda

Python PyTorch

Старший разработчик в команду ML-планера робота доставки (RL)

Задачи и обязанности

Требования

Дополнительные требования

Похожие вакансии