ML-исследователь генеративных моделей персонализации
Мы решаем задачу персонализации с помощью LLM-подобных технологий: переводим пользователей в специализированное пространство токенов и обрабатываем полученные последовательности с помощью генеративных моделей. Результаты работы нашей команды применяются во всех крупных рекомендательных системах Яндекса.
Исследования в нашей команде охватывают следующие области:
- Претрейн генеративных моделей со случайных весов
- Адаптация индустриальных архитектурных трендов, таких как MoE, квантизация, Linear Attention, техник сжатия контекста
- Обучение reward-моделей на основе трансформерной архитектуры
- RL с использованием разновидностей GRPO
- Continuous learning
- Модели токенизации пользователя
Также мы публикуем работы на международных конференциях:
Наша мечта — построить одностадийную генеративную рекомендательную систему и встроить её в LLM как новую модальность.
Задачи и обязанности
Оптимизировать архитектуру нейросети
Мы постоянно развиваем архитектуру и рецепты обучения наших моделей, адаптируя последние индустриальные тренды. Наша задача — не только обеспечить высокое качество предсказания, но и выдерживать нагрузку, создаваемую многими миллионами пользователей Яндекса.
Развивать алгоритмы токенизации
Токенизация в генеративных моделях персонализации — активно развивающаяся область. Она включает в себя построение семантических моделей, исследование алгоритмов квантизации, а также continuous learning.
Исследовать Alignment с использованием RL
Мы строим алгоритмы, которые адаптируются под вкусы пользователей с использованием GRPO, обучаясь как на reward-модели, так и на прямом фидбэке.
Интегрироваться в LLM в качестве новой модальности
Мы исследуем не только модели генеративной персонализации, но и возможности их объединения с LLM, чтобы строить системы с уникальными свойствами: способностью следовать инструкциям и объяснять рекомендации.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Глубоко понимаете, как устроен современный DL с научной и инженерной точек зрения
- Командный игрок: готовы браться за широкий спектр задач, которые продвигают команду вперёд
- Следите за трендами в таких областях, как LLM, мультимодальность, RecSys