ML-инженер-исследователь в перевод видео в Браузере
Мы ищем сильного ML-инженера-исследователя, готового строить с нуля и внедрять инновации. Вы будете работать над критически важным направлением службы синтеза речи — технологией перевода видео в Яндекс Браузере. Наша цель — вывести голос переведённого видео на уровень, где сохраняется оригинальная подача, естественность и эмоциональность, интонационный рисунок и даже манера пения.
Ваши разработки обеспечат миллионам пользователей максимально естественный и эмоционально точный перевод видеоконтента, стирая языковые барьеры и делая контент ещё более доступным и живым. Вы будете работать на самых сложных участках ML, решая задачи переноса и сохранения всех нюансов речи.
Задачи и обязанности
Разработка и внедрение ML-моделей
Для точного анализа исходной аудиодорожки и переноса интонации, эмоциональной окраски и темпа речи в синтезированный перевод.
Работа над воспроизведением элементов невербальной коммуникации
Смех, вздохи, заминки, междометия и другие естественные особенности речи критически важны для максимальной естественности перевода.
Исследование и создание алгоритмов
Для успешного копирования и синтеза пения на целевом языке.
Анализ и улучшение алгоритмов
Для минимизации ошибок произношения в синтезе речи.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Уверенно владеете Python, прекрасно разбираетесь во фреймворках машинного обучения, в частности PyTorch
- Работали на практике с распределённым обучением и большими моделями
- Имеете широкий технический кругозор в NLP и готовы внедрять новые технологии с нуля
- Хотите погружаться в область синтеза речи, готовы разбираться как в теории, так и в инженерных деталях реализации
- Способны следить за развитием машинного обучения и превращать исследовательские идеи в надёжный, работающий код
Дополнительные требования
- Работали с мультимодальными или генеративными моделями
- Имеете опыт в области TTS/VC (Text-to-Speech/Voice Conversion).