ML-разработчик в группу обучения с подкреплением (RL)
Решение задачи планирования движения — один из самых больших вызовов в отрасли автономных технологий. Мы экспериментируем с большими генеративными моделями, чтобы предсказывать траекторию движения автомобиля. Такая траектория должна обеспечивать безопасное взаимодействие с участниками движения, быть комфортной для пассажира и помогать автомобилю добраться до конечной точки маршрута.
Чтобы модель лучше справлялась с новыми дорожными ситуациями, мы ищем способы её улучшения: исследуем новые алгоритмы RL-обучения и работаем с данными. Для повышения качества езды в нестандартных ситуациях мы создаём синтетические сложные дорожные ситуации и включаем их в обучение модели.
Вам предстоит развивать алгоритм, чтобы автономный транспорт качественно работал в городе и на трассе.
Задачи и обязанности
Улучшение RL-моделей
Вы будете учить трансформеры извлекать информацию о взаимодействии участников движения с траекторией автомобиля, проверять и внедрять современные подходы из научных статей об автономном вождении, а также экспериментировать с архитектурами, наградами и методами обучения.
Исследование синтетических данных
Вам предстоит экспериментировать с методами обучения с подкреплением, включая использование среды, и исследовать возможности добавления синтетических данных в такое обучение.
Внедрение разработок в автомобили
Вы будете внедрять свои разработки в пайплайн движения автомобиля и наблюдать, как ваша работа повышает качество технологии.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Обучали нейросетевые модели, внедряли DL-решения в продакшен
- Ориентируетесь в области DL, быстро разбираетесь в новых методах
- Программируете на Python, работали с PyTorch
- Знаете классические структуры данных и алгоритмы
- Умеете выдвигать гипотезы и выстраивать эксперименты для их проверки
- Читаете статьи о ML, следите за развитием этой области
Дополнительные требования
- Внедряли методы обучения с подкреплением в продакшен
- Публиковались в сборниках научных конференций высокого уровня
- Работали с большими объёмами данных
- Участвовали в соревнованиях по ML или спортивному программированию
- Увлечены автомобилями или автономными автомобилями