Старший LLM-разработчик в команду алайнмента YandexGPT
Мы в Яндексе строим полезные и безопасные модели и продукты, которыми уже сегодня пользуются миллионы. Команда алайнмента — это место, где фундаментальные идеи трансформируются в реальный продукт: от улучшения рассуждений моделей и агентных возможностей до надёжного RAG и масштабируемой модели. У нас одна из сильнейших в индустрии компетенций в области RL и RLHF: мы разрабатываем и внедряем методы вознаграждения и обучения с подкреплением, которые напрямую формируют поведение моделей в Alice AI.
Приходите работать на стыке ресёрча и продукта: делать лучшую ассистентскую модель Alice AI на российском рынке, запускать пилоты с прикладными командами и масштабировать решения для миллионов пользователей.
Задачи и обязанности
Улучшать базовую модель Alice AI LLM
Продумывать масштабируемые модели награды и улучшать различные В2С-свойства модели (человечность, красоту ответа) при помощи RLHF.
Усиливать reasoning-свойства моделей
Разрабатывать модели награды и тренировки, повышающие точность пошагового рассуждения, надёжность планирования и способность модели проверять себя.
Строить RAG следующего поколения
Не просто учить модель использовать контексты, но и понимать их пользу в каждом конкретном сценарии.
Работать с агентскими моделями
Улучшать агентские свойства модели, извлекать пользу из tool-call-режима для продуктов.
Улучшать модель на образовательных задачах
Превращать Alice AI LLM в помощника не только для школьника, но и развивать её в области сложных вузовских предметов.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Отлично знаете классические ML и NLP
- Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт
- Следите за трендами в области LLM. Можете бегло прочитать статью и быстро понять основную идею