← Все вакансии

ML-разработчик в группу обучения с подкреплением (RL)

Решение задачи планирования движения — один из самых больших вызовов в отрасли автономных технологий. Мы экспериментируем с большими генеративными моделями, чтобы предсказывать траекторию движения автомобиля. Такая траектория должна обеспечивать безопасное взаимодействие с участниками движения, быть комфортной для пассажира и помогать автомобилю добраться до конечной точки маршрута.

Чтобы модель лучше справлялась с новыми дорожными ситуациями, мы ищем способы её улучшения: исследуем новые алгоритмы RL-обучения и работаем с данными. Для повышения качества езды в нестандартных ситуациях мы создаём синтетические сложные дорожные ситуации и включаем их в обучение модели.

Вам предстоит развивать алгоритм, чтобы автономный транспорт качественно работал в городе и на трассе.

Задачи и обязанности

Улучшение RL-моделей


Вы будете учить трансформеры извлекать информацию о взаимодействии участников движения с траекторией автомобиля, проверять и внедрять современные подходы из научных статей об автономном вождении, а также экспериментировать с архитектурами, наградами и методами обучения.

Исследование синтетических данных


Вам предстоит экспериментировать с методами обучения с подкреплением, включая использование среды, и исследовать возможности добавления синтетических данных в такое обучение.

Внедрение разработок в автомобили


Вы будете внедрять свои разработки в пайплайн движения автомобиля и наблюдать, как ваша работа повышает качество технологии.

Больше об ML в Яндексе — в канале Yandex for ML

Требования

  • Обучали нейросетевые модели, внедряли DL-решения в продакшен
  • Ориентируетесь в области DL, быстро разбираетесь в новых методах
  • Программируете на Python, работали с PyTorch
  • Знаете классические структуры данных и алгоритмы
  • Умеете выдвигать гипотезы и выстраивать эксперименты для их проверки
  • Читаете статьи о ML, следите за развитием этой области

Дополнительные требования

  • Внедряли методы обучения с подкреплением в продакшен
  • Публиковались в сборниках научных конференций высокого уровня
  • Работали с большими объёмами данных
  • Участвовали в соревнованиях по ML или спортивному программированию
  • Увлечены автомобилями или автономными автомобилями
Python PyTorch
Откликнуться →