ML-разработчик-исследователь в команду Alignment службы синтеза речи

Мы ищем сильного ML-разработчика-исследователя в команду Alignment службы синтеза речи. Наша цель — вывести синтезированную речь на уровень, когда она будет абсолютно неотличима от человеческой по интонации, эмоциональности, выразительности и естественности.

Ваши разработки — это фундамент, который обеспечит высококачественный голос в Алисе, озвучивании Яндекс Книг и технологии перевода видео в Яндекс Браузере. Это работа с огромным влиянием на продукты, которыми ежедневно пользуются миллионы.

Ваша ключевая роль — проектировать и внедрять передовые методы обучения, чтобы научить модели понимать, что значит «говорить хорошо». Нам нужен ML-инженер-исследователь, готовый принимать сложные научные и технические вызовы.

Задачи и обязанности

Дизайн reward-моделей

Вам предстоит создавать целевые метрики и reward-модели, способные точно оценивать естественность и выразительность синтеза, которые станут основой для дообучения.

Внедрение RL-методов

Вам нужно будет адаптировать и имплементировать современные алгоритмы обучения с подкреплением (DPO, GRPO и их модификации) для повышения правильности произношения, интонационной вариативности и естественности речи.

Улучшение пайплайна

Вашей задачей будет постоянное совершенствование базовой технологии дообучения для повышения стабильности и эффективности процесса.

От идеи до замеров

На вас будет полный цикл работы: от анализа последних научных статей и проведения PoC до замера качества полученной модели.

Больше об ML в Яндексе — в канале Yandex for ML

Требования

Уверенно владеете Python и обладаете экспертным опытом во фреймворках машинного обучения, в частности PyTorch
Имеете практический опыт работы с распределённым обучением и большими моделями
Обладаете широким техническим кругозором в NLP и готовы внедрять новые технологии с нуля
Хотите погрузиться в область синтеза речи, готовы разбираться как в теории, так и в инженерных деталях реализации
Способны следить за развитием машинного обучения и воплощать исследовательские идеи в надёжном, работающем коде

Дополнительные требования

Работали с мультимодальными или генеративными моделями
Имеете сильный практический опыт в обучении с подкреплением (RL)

Python PyTorch

ML-разработчик-исследователь в команду Alignment службы синтеза речи

Задачи и обязанности

Требования

Дополнительные требования

Похожие вакансии