DL-разработчик в Яндекс Картинки
Яндекс Картинки — самый популярный сервис поиска изображений в России, который ежедневно помогает миллионам пользователей находить нужные визуальные материалы. Мы улучшаем пользовательский опыт, делая поиск более точным. Основная задача — разработка и внедрение SOTA мультимодальных нейросетей в сервис, который ежесекундно обрабатывает десятки тысяч запросов. Мы активно работаем над качеством ранжирования, семантическим пониманием запросов и изображений, а также над новыми форматами взаимодействия с контентом. Всё это требует не только глубокой экспертизы в DL, но и внимания к реальным потребностям пользователей.
Задачи и обязанности
Усиление базового стека
Мы регулярно улучшаем базовые нейротехнологии, заимствуем опенсорс-решения, адаптируем к нашим реалиям и делаем их лучше. Вам предстоит прокачивать CLIP архитектуры, извлекать профит из последних VLM, искать способы лучше понимать изображение через текст и многое другое.
Усиление веб-релевантности
Хоть наш сервис в первую очередь предназначен для поиска визуального контента, пользователям также важно находить нужные источники. Вы будете разрабатывать нейросети с учётом как картиночной, так и текстовой модальностей для предсказания веб-релевантности.
Эксперименты с особенно сложными запросами
Классические модели ранжирования позволяют решать большую часть поисковых сценариев. Но всегда существует узкий класс сложных запросов, на которых даже асессоры будут ошибаться. Для улучшения качества на таком срезе запросов мы открыты к самым смелым экспериментам: от мультиагентных систем до обучения с подкреплением классических моделей ранжирования.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Решали продуктовые ML-задачи: от сбора данных до деплоя модели
- Работали с дискриминативными NLP-моделями
- Понимаете, как работает ранжирование / рекомендательные системы
- Владеете Python и C++
Дополнительные требования
- Работали с retrieval/reranking
- Понимаете устройство современных VLM