Старший LLM-разработчик в команду алайнмента YandexGPT

Мы в Яндексе строим полезные и безопасные модели и продукты, которыми уже сегодня пользуются миллионы. Команда алайнмента — это место, где фундаментальные идеи трансформируются в реальный продукт: от улучшения рассуждений моделей и агентных возможностей до надёжного RAG и масштабируемой модели. У нас одна из сильнейших в индустрии компетенций в области RL и RLHF: мы разрабатываем и внедряем методы вознаграждения и обучения с подкреплением, которые напрямую формируют поведение моделей в Alice AI.

Приходите работать на стыке ресёрча и продукта: делать лучшую ассистентскую модель Alice AI на российском рынке, запускать пилоты с прикладными командами и масштабировать решения для миллионов пользователей.

Задачи и обязанности

Улучшать базовую модель Alice AI LLM

Продумывать масштабируемые модели награды и улучшать различные В2С-свойства модели (человечность, красоту ответа) при помощи RLHF.

Усиливать reasoning-свойства моделей

Разрабатывать модели награды и тренировки, повышающие точность пошагового рассуждения, надёжность планирования и способность модели проверять себя.

Строить RAG следующего поколения

Не просто учить модель использовать контексты, но и понимать их пользу в каждом конкретном сценарии.

Работать с агентскими моделями

Улучшать агентские свойства модели, извлекать пользу из tool-call-режима для продуктов.

Улучшать модель на образовательных задачах

Превращать Alice AI LLM в помощника не только для школьника, но и развивать её в области сложных вузовских предметов.

Больше об ML в Яндексе — в канале Yandex for ML

Требования

Отлично знаете классические ML и NLP
Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт
Следите за трендами в области LLM. Можете бегло прочитать статью и быстро понять основную идею

LLM