ML-разработчик-исследователь в команду Alignment службы синтеза речи
Мы ищем сильного ML-разработчика-исследователя в команду Alignment службы синтеза речи. Наша цель — вывести синтезированную речь на уровень, когда она будет абсолютно неотличима от человеческой по интонации, эмоциональности, выразительности и естественности.
Ваши разработки — это фундамент, который обеспечит высококачественный голос в Алисе, озвучивании Яндекс Книг и технологии перевода видео в Яндекс Браузере. Это работа с огромным влиянием на продукты, которыми ежедневно пользуются миллионы.
Ваша ключевая роль — проектировать и внедрять передовые методы обучения, чтобы научить модели понимать, что значит «говорить хорошо». Нам нужен ML-инженер-исследователь, готовый принимать сложные научные и технические вызовы.
Задачи и обязанности
Дизайн reward-моделей
Вам предстоит создавать целевые метрики и reward-модели, способные точно оценивать естественность и выразительность синтеза, которые станут основой для дообучения.
Внедрение RL-методов
Вам нужно будет адаптировать и имплементировать современные алгоритмы обучения с подкреплением (DPO, GRPO и их модификации) для повышения правильности произношения, интонационной вариативности и естественности речи.
Улучшение пайплайна
Вашей задачей будет постоянное совершенствование базовой технологии дообучения для повышения стабильности и эффективности процесса.
От идеи до замеров
На вас будет полный цикл работы: от анализа последних научных статей и проведения PoC до замера качества полученной модели.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Уверенно владеете Python и обладаете экспертным опытом во фреймворках машинного обучения, в частности PyTorch
- Имеете практический опыт работы с распределённым обучением и большими моделями
- Обладаете широким техническим кругозором в NLP и готовы внедрять новые технологии с нуля
- Хотите погрузиться в область синтеза речи, готовы разбираться как в теории, так и в инженерных деталях реализации
- Способны следить за развитием машинного обучения и воплощать исследовательские идеи в надёжном, работающем коде
Дополнительные требования
- Работали с мультимодальными или генеративными моделями
- Имеете сильный практический опыт в обучении с подкреплением (RL)