ML-разработчик в команду поисковых подсказок
Саджест (поисковые подсказки) — один из самых востребованных сервисов Яндекса. Мы отдаём более 100 тысяч запросов в секунду и 99,9% из них — меньше чем за 100 мс. Более 100 миллионов пользователей отправляют запросы в саджест ежедневно.
Ищем разработчика, который поможет нам внедрить современные технологии машинного обучения и улучшить существующую инфраструктуру высоконагруженного сервиса. Вы сможете познакомиться с существующим архитектурными и программными решениями и внедрить свои собственные.
Задачи и обязанности
Разработка ранжирования и генеративного саджеста
Вам предстоит проводить эксперименты с моделями и фичами ранжирования поисковых подсказок, обучать маленькие LLM для генерации подсказок.
ML в высоконагруженных сервисах
Вы будете решать ML-задачи на огромном потоке, искать компромиссы и оптимизировать.
Работа с ML-инфраструктурой
Нужно будет строить пайплайн обработки данных и конвейеризовать обучение моделей.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Умеете и любите программировать
- Имеете опыт разработки на объектно-ориентированных языках программирования (в идеале Python, C++)
- Применяли алгоритмы машинного обучения на практике
- Понимаете принципы работы современных ML-моделей
- Разбираетесь в классических алгоритмах и структурах данных
- Занимались параллельным и многопоточным программированием