← Все вакансии

Аналитик-разработчик в Международный Поиск

Приложение Yandex AI (Турция) — это не просто выдача ссылок. Yandex AI создаёт подробные структурированные ответы с разделами, картинками и видео. Но как понять, что качество этих ответов хорошее?

На этот вопрос можно отвечать по-разному: например, классический подход — анализировать поведение пользователей. Но современный интернет стал настолько сложным, что часто одних онлайн-метрик недостаточно. Поэтому мы подходим к задаче комплексно: дополнительно строим офлайн-приборы, которые позволяют перед экспериментами заранее отвечать на конкретные практические вопросы. Соответствуют ли ответы запросам пользователей? Стали ли они лучше? Как часто в них встречаются серьёзные ошибки?

Вы будете не просто анализировать данные, а создавать правила и метрики, которые станут детектором качества для ответов.

К чему мы стремимся

Сделать приложение нового поколения

Не просто выдачу ссылок, а интеллектуального помощника, способного решать задачи пользователя на месте, без необходимости переходить куда-либо.

Не только на русском

Мы запускаемся в новых регионах, где нас ждут новые вызовы, связанные с языковыми и региональными особенностями.

К богатым ответам

Наша цель — ответы, где текст, мультимедиа, карты, новости и многое другое работают вместе. Мы делаем информацию живой, чтобы она запоминалась с первого взгляда.

Не врать!

Никаких домыслов или «креативных интерпретаций». Мы строго следим, чтобы ответы опирались на проверенные данные, а каждое утверждение подкреплялось надёжными источниками. Мы учим модели не фантазировать, а опираться на факты, даже если это сложнее.

У нас классно, потому что:

  • Мы работаем над приложением Yandex AI — продуктом Яндекса на основе LLM — и ориентированы прежде всего на результат в продакшне.
  • Наши задачи тесно связаны и с дизайном самого продукта, и с ML.
  • Мы даём возможность развивать как технические, так и коммуникативные и менеджерские навыки.
  • Ваша работа прямо повлияет на то, каким станет приложение Yandex AI через полгода.
  • Мы делаем уникальные по сложности, масштабу и архитектуре краудсорс-проекты.
  • У нас слаженная команда аналитиков и ML-инженеров качества.

Задачи и обязанности

Управление редакторами и системой качества в краудсорс-проекте

Вы будете отвечать за полный цикл работы редакторов: обеспечивать выполнение плана по разметке в срок и с требуемым уровнем качества, управлять их производительностью и снижением «шума», а также проектировать и внедрять методологии оценки.

В ваши задачи также будет входить разработка надёжных инструментов контроля качества, построение прозрачной системы измерения эффективности исполнителей, запуск обучающих программ и механизмов обратной связи, формирование критериев отбора и отсева. Цель — выстроить сквозную, технически реализованную систему управления качеством и эффективностью редакторов, напрямую влияющую на итоговый результат проекта.

Обеспечение надёжного хранения, обработки и доступности данных разметки

Генерация разметки производит значительные объёмы данных. Вы будете отвечать за проектирование и поддержку инфраструктуры, гарантирующей целостность и сохранность этих данных. Это включает разработку и поддержку ETL-процессов для очистки, трансформации и загрузки данных в аналитические хранилища, создание механизмов фильтрации и агрегации, формирование удобных для анализа таблиц и представлений.

Разработка систем LLM-as-Judge

Для эффективного дообучения моделей в соответствии с внутренними принципами качества объёма человеческой разметки зачастую недостаточно. В связи с этим разрабатываются автоматизированные методы оценки качества с использованием LLM в роли judge-моделей.

В рамках данной задачи предполагается развитие таких систем, оценка их надёжности и валидности, а также интеграция получаемых сигналов в процессы дообучения моделей.

Больше об аналитике в Яндексе — в канале Yandex for Analytics

Требования

  • Пишете на Python и SQL
  • Знаете математическую статистику и теорию вероятностей
  • Любите работать с данными и умеете извлекать из них практический результат
  • Умеете общаться в команде, ясно излагать мысли, понимать и убеждать коллег
  • Готовы разбираться в том, как и почему должен работать продукт

Дополнительные требования

  • Работали с Толокой или другими краудсорс-платформами
  • Писали инструкции и самостоятельно запускали проекты разметки данных
  • Знаете принципы функционирования и разработки LLM
  • Обладаете продвинутыми навыками промпт-инжиниринга
Python SQL LLM
Откликнуться →