Аналитик GPT-моделей в Алису

Основная ответственность аналитика — сбор данных для обучения и оценка качества моделей через построение автоматизированных систем обработки данных. Для оценки качества используем как офлайн-подход (оценка качества на заранее собранных корзинах), так и онлайн-подход (проводим А/В-эксперименты). Продовые модели на основе собранных нами данных обучают ML-разработчики, а мы применяем ML для анализа логов, создания метрик и упрощения своей жизни.

Для аналитика работа с Алисой — это уникальный микс продуктовых исследований и Data Science, возможность работать с разными устройствами (телефонами, колонками, телевизорами, автомобилями и не только) и участвовать в создании виртуального ассистента, в отношении которого не стыдно применить термин Artificial Intelligence (AI).

Алиса и наша команда — это:

передовой продукт с MAU >70M с состоявшейся бизнес-моделью, где сохранено умение двигаться с целью максимально быстро приносить пользу людям;
продукт, который экономит пользователям «когнитивные калории», помогает в развитии и работе, развлекает и поддерживает беседой, может решать широкий спектр повседневных и сложных человеческих задач;
неравнодушная аудитория пользователей и коллег, которая даёт быструю обратную связь;
место работы, где легко и не стыдно показать другим людям, чем занимаешься и каков твой вклад в работу;
место развития технологий Cutting Edge, где ещё нет готовых решений, задачи не имеют потолка сложности и дают шанс сделать что-то первым в мире.

Очевидно, что прогресс в AI доходит до уровня Commodity на уровне гонки моделей, а ценность для человечества переходит в сторону решения задач в реальном мире. Многие задачи нельзя решить одной моделью в точке через порепличное взаимодействие в чате, поэтому мы делаем большую ставку на агентов.

Мы хотим создать вау-продукт на базе агентских технологий. В общем виде это:

система, которая решает растянутые во времени задачи, может выяснить все детали, разработать план и использовать набор внешних инструментов для достижения цели;
Алиса — оркестратор технологий, личный ассистент и второй мозг, она проактивна и персональна;
умение качественно решать задачи людей в разнообразных и естественных формулировках, для которых в пресс-релизе достаточно одной строчки — «Алисе теперь можно делегировать...».

Задачи и обязанности

Метрика качества Алисы и агентских систем end-to-end

Вместе с нами вы будете разрабатывать общую систему офлайн-метрик Алисы, делать пайплайн оценки, определять критерии качества и данные для создания вау-продукта.

Качество решения агентских задач

Для отдельных задач агентов нужно будет обеспечить дополнительные продуктовые метрики качества и данные.

Рефлексия, память и персонализация

Алиса должна знать о своих умениях и возможностях, не забывать, о чём с ней общались раньше, и не быть бездушной системой. Вы будете работать над этим.

Больше о бэкенде в Яндексе — в канале Yandex for Backend

Требования

Знаете теорию вероятностей и математическую статистику
Глубоко владеете SQL, Python/Pandas
Умеете писать аналитический production-код и создавать инструкции, способны видеть продукт или проект в целом
Работали как с Data Science, так и с продуктовой аналитикой
Обладаете навыками анализа и построения эффективных процессов обработки данных
Интересуетесь развитием AI-помощников
Инициативны и готовы к самостоятельному поиску решений

Дополнительные требования

Работали с NLP, краудсорсинговыми разметками и ML

Python SQL Pandas

Аналитик GPT-моделей в Алису

Задачи и обязанности

Требования

Дополнительные требования

Похожие вакансии