← Все вакансии

Руководитель группы рантайма в Алису

Алиса — сложный высоконагруженный сервис на базе больших языковых моделей. С каждым годом Алиса становится умнее и помогает пользователям решать всё более сложные задачи.

Сейчас мы всё чаще применяем для этого большие языковые модели (LLM).

Каждая модель хорошо справляется с какой-то одной задачей, но обучить одну универсальную модель, которая идеально решит все задачи, очень сложно. Поэтому мы учим модели работать друг с другом, превращая их в агентов. Каждый агент специализируется на чём-то своём: один ищет информацию в интернете, другой управляет браузером, третий работает с файлами или приложениями.

Алиса состоит из множества компонентов и работает на большом семействе платформ. Мы хотим создать новый единый гомогенный рантайм, который будет отвечать современным требованиям и сможет поддерживать как долгие агентские задачи, так и запросы, требующие мгновенного ответа.

Задачи и обязанности

Проектировать архитектуру Алисы и разрабатывать рантайм

Алиса должна уметь работать как с долгими задачами (десятки минут), так и с быстрыми запросами (сотни миллисекунд), причём единообразно и без лишнего оверхеда.

Алиса должна оставаться надёжной, эффективной и масштабируемой, обрабатывать десятки тысяч RPS.

Алиса работает с разнообразными видами входных данных: файлами, картинками, голосом, текстом.

Рантайм позволяет прокачивать и принимать и систему в целом, и любой компонент (модели, тулы, агенты), траектории пишутся в единых терминах.

Архитектура должна быть прозрачной и понятной.

Больше о бэкенде в Яндексе — в канале Yandex for Backend

Требования

  • Умеете проектировать высоконагруженные серверные системы с жёсткими требованиями к latency и стабильности
  • Понимаете, как строятся асинхронные пайплайны с большим количеством сетевых вызовов (оркестрация LLM, tool’ов и внешних вызовов)
  • Разрабатывали распределённые системы, где важно управление состоянием, потоками данных и отказоустойчивостью
  • Готовы писать на C++

Дополнительные требования

  • Работали с Temporal или другой системой оркестрации
  • Интересуетесь LLM и представляете, как они работают
Python LLM
Откликнуться →