← Все вакансии

Аналитик-разработчик в команду голосовых технологий

Алиса — AI-ассистент Яндекса, которым пользуются более 10 миллионов человек в месяц. Она умеет поддерживать разговор, управлять умным домом, развлекать детей и даже обучать английскому языку. Алиса живёт в колонках и телефонах, телевизорах и автомобилях. Отвечая более чем на 7 миллиардов запросов в месяц, Алиса становится неотъемлемой частью нашего общества и образа Яндекса.

Голосовой ввод — самый частый и естественный сценарий взаимодействия с Алисой. По голосу пользователя, когда он обращается к колонке, нужно уметь понимать не только что именно он хотел сказать, но и кто это из членов семьи, какого он возраста, а в идеале и какое сейчас у него настроение. Мы обеспечиваем качество данных и ML-моделей, которые реализуют весь этот функционал.

Задачи и обязанности

Создание метрик для ML-моделей


Наша команда не обучает модели, но пытается ответить на вопрос, что такое «хорошо» для ML-модели. За ним скрывается множество исследований данных, поведения моделей, генерации и проверки гипотез, потому что это «хорошо» значительно проще описать интуитивно, чем заключить в строгие математические формулы.

Сбор данных через краудсорсинг


Обучение и валидация моделей требуют большого количества очень хорошо размеченных данных. Получить которые чаще всего можно, только специально попросив людей их разметить. Что именно, с каким пониманием инструкции и насколько качественно будут размечать — вот вопросы, на которые мы должны уметь ответить.

Продуктовые исследования


Мы помогаем направлять развитие продукта, вглядываясь в данные. Чтобы понять потребности и боли пользователей, мы исследуем всё — от конкретных баг-репортов до ежедневных терабайт данных про пользование Алисой. А когда все решения по нашим числам приняты, смотрим А/В-тесты и оцениваем реальную пользу (или вред) от изменений.

Больше об аналитике в Яндексе — в канале Yandex for Analytics

Требования

  • Занимались аналитикой больше двух лет
  • Уверенно пишете на Python и SQL, знакомы с основными библиотеками
  • Знаете основы машинного обучения
  • Любите смотреть в данные и приносить пользу продукту и пользователю

Дополнительные требования

  • Знакомы с YQL, Python, Нирваной, Толокой
  • Знаете статистику
  • Любите и умеете структурировать информацию, выделять важное
Python SQL
Откликнуться →