ML-разработчик в международные продукты Поиска
Наша команда отвечает за контентные продукты в рамках международного развития Поиска. Например, за вертикали спорта и землетрясений для Турции.
Один из основных приоритетов — развитие генеративных ответов в чатовом формате. Для этого предстоит создавать с нуля AI-ассистентов. Вы сможете влиять на новый развивающийся проект, общаться с бизнес-заказчиками, доставлять фичи до прода и быстро получать обратную связь от реальных пользователей, а затем итеративно улучшать ML-модели.
Кроме этого, мы создаём полноценные поисковые сервисы, работающие под нагрузкой в тысячи запросов в секунду. Если захотите — можно получить опыт в разработке инфраструктуры, бэкенда или в улучшении качества наших сервисов.
Задачи и обязанности
Развитие AI-ассистентов
Вам предстоит обучать большие языковые модели (LLM) генерировать ответы на запросы пользователей и поддерживать диалог. Понадобится собирать прототипы и обучающие выборки, заниматься дистилляцией тяжёлых моделей для эффективного инференса, улучшать качество ответов через цикл экспериментов с методами обучения с подкреплением (RL), а также оценивать качество моделей с помощью различных подходов.
Улучшение качества наших продуктов
Вы сможете поучаствовать в каждой стадии разработки ML-продукта: от исследования пользовательских предпочтений и разработки MVP до обучения и внедрения моделей и пайплайнов в продукт. Предстоит иметь дело с разнообразными ML-инструментами и задачами: дообучать LLM-модели, улучшать ранжирование и кластеризацию, разрабатывать метрики для оценки качества продукта, а также проводить A/B-тесты с новыми фичами. Примеры направлений работы: генеративные вопросы и ответы для спортивных событий, поиск по спортивным объектам, выделение трендов в спортивной повестке.
Инфраструктурные и рантаймовые задачи (при желании)
Мы регулярно запускаем крупные блоки продукта, для которых требуется реализовать ML-часть и инфраструктурные составляющие, а также оптимизировать текущие пайплайны — например, для экономии GPU или поиска баланса скорости и качества.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Встраивали ML‑решения в реальные продукты
- Хорошо знаете Python (или C++), ML и NLP
- Знакомы с современными подходами к обучению LLM и следите за трендами в этой области
Дополнительные требования
- Работали с высоконагруженными сервисами
- Разбираетесь в нейросетевых архитектурах
- Знакомы с технологиями обработки больших данных