ML-разработчик в команду качества визуального Екома
Наш продукт — ранжирование визуального Екома. Мы улучшаем пользовательский опыт покупки товаров с помощью визуала, помогаем найти красивые, визуально привлекательные товары в интернете. Наша команда решает очень непростую задачу: собрать товары и их изображения со всего интернета и выдать пользователю самые релевантные предложения по его запросу.
Задачи и обязанности
Объединение предложений из интернета в единую сущность (склейка)
Одно из основных направлений этого года — улучшить пользовательский опыт при выборе товаров в визуальных категориях. Мы решаем крайне сложную задачу: собрать данные о товарах с различных источников и объединить их в карточку товара, предоставив пользователю удобный интерфейс для выбора.
Обучение ранжирующих моделей
Мы активно работаем над ранжированием товаров и изображений. Разработка ранжирования подразумевает как работу над множеством факторов, используемых моделями, так и эксперименты с подходами к их обучению.
Улучшение персонализации в ранжировании товаров и картинок
Мы строим персонализированное ранжирование и пытаемся предоставить пользователю именно тот товар, который он хочет купить. Для этого мы обучаем множество различных моделей: от простых запросных/документных классификаторов до ранжирующих DL-моделей, учитывающих историю и профиль пользователя.
Повышение точности соответствия документов запросам
Один из ключевых треков — повышение релевантности документа запросу. Мы активно работаем с асессорскими разметками релевантности, обучаем на их основе крупные LLM/VLM-модели и дистиллируем из них сложные продакшен-решения
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Работали с PyTorch или готовы быстро в него погрузиться
- Владеете Python и C++ на уровне, достаточном для реализации своих идей
- Имеете опыт в одной из областей: RecSys или Computer Vision
- Любите проявлять инициативу и предлагать свои решения продуктовых проблем
Дополнительные требования
- Работали с разметкой данных, например в Яндекс Толоке или Яндекс Заданиях
- Работали с современными рекомендательными системами и глубокими Doc2Vec-моделями
- Разрабатывали решения для сервисов с критическими требованиями к рантайму и понимаете специфику обучения и оптимизации моделей под них
- Понимаете специфику товарного поиска