ML-разработчик в направление автоматизации контентных задач и документирования
Yandex Crowd — это крупный инфраструктурный сервис Яндекса. Мы внедряем краудсорсинг, чтобы расширять бизнес-процессы: разметку данных, модерацию контента, полевые исследования, тестирование. Кроме того, мы разрабатываем внутренние функции для наших продуктов: клиентский сервис, телемаркетинг, дизайн, локализацию и документирование.
Одна из наших целей — автоматизировать рутинные процессы в работе краудсорс-исполнителей. Мы создаём copilots для дизайнеров, редакторов, локализаторов, а также встраиваем генеративные технологии напрямую в платформы заказов.
Ищем ML-разработчика, которому предстоит пройти путь от создания MVP до реализации полноценного продукта с использованием GenAI-технологий, погрузиться в режим стартапа, поработать с топовыми моделями и придумать лучшие версии архитектур.
Задачи и обязанности
Исследовать и внедрять передовые технологии
Вы будете экспериментировать с новейшими мультимодальными GenAI-моделями (VLM, Diffusion и т. д.), фреймворками для агентских систем и новыми подходами к автоматизации задач дизайна и редактуры.
Разрабатывать AI-решения для интеграции в микросервисы
Вам предстоит участвовать в разработке надёжных масштабируемых сервисов. Например, мы автоматизируем дизайн-процессы: создаём внутренние инструменты, которые закрывают большое количество специфических задач Яндекса и снимают рутинную нагрузку с дизайнеров.
Работать в продуктовой команде
Нужно будет совместно с заказчиками и разработкой проверять смелые гипотезы, запускать пилоты, собирать обратную связь и улучшать решения.
Больше об ML в Яндексе — в канале Yandex for ML
Требования
- Работали с NLP и CV
- Знаете основы DL и трансформеров
- Хорошо знаете Python, имеете опыт продакшен-разработки, работали с агентскими фреймворками
- Хотите стать экспертом, который будет самостоятельно развивать и поддерживать ряд моделей и продуктов
- Применяете продуктовый подход: умеете формулировать цели, проверять гипотезы и думать о целевом процессе
- Критически мыслите: сравниваете варианты и выбираете оптимальный по данным, рискам и стоимости
Дополнительные требования
- Настраивали пайплайны дообучения, оценки качества, guardrails и безопасной генерации
- Оптимизировали инференс моделей (квантизация, дистилляция и т. д.)