Руководитель группы рантайма в Алису
Алиса — сложный высоконагруженный сервис на базе больших языковых моделей. С каждым годом Алиса становится умнее и помогает пользователям решать всё более сложные задачи.
Сейчас мы всё чаще применяем для этого большие языковые модели (LLM).
Каждая модель хорошо справляется с какой-то одной задачей, но обучить одну универсальную модель, которая идеально решит все задачи, очень сложно. Поэтому мы учим модели работать друг с другом, превращая их в агентов. Каждый агент специализируется на чём-то своём: один ищет информацию в интернете, другой управляет браузером, третий работает с файлами или приложениями.
Алиса состоит из множества компонентов и работает на большом семействе платформ. Мы хотим создать новый единый гомогенный рантайм, который будет отвечать современным требованиям и сможет поддерживать как долгие агентские задачи, так и запросы, требующие мгновенного ответа.
Задачи и обязанности
Проектировать архитектуру Алисы и разрабатывать рантайм
Алиса должна уметь работать как с долгими задачами (десятки минут), так и с быстрыми запросами (сотни миллисекунд), причём единообразно и без лишнего оверхеда.
Алиса должна оставаться надёжной, эффективной и масштабируемой, обрабатывать десятки тысяч RPS.
Алиса работает с разнообразными видами входных данных: файлами, картинками, голосом, текстом.
Рантайм позволяет прокачивать и принимать и систему в целом, и любой компонент (модели, тулы, агенты), траектории пишутся в единых терминах.
Архитектура должна быть прозрачной и понятной.
Больше о бэкенде в Яндексе — в канале Yandex for Backend
Требования
- Умеете проектировать высоконагруженные серверные системы с жёсткими требованиями к latency и стабильности
- Понимаете, как строятся асинхронные пайплайны с большим количеством сетевых вызовов (оркестрация LLM, tool’ов и внешних вызовов)
- Разрабатывали распределённые системы, где важно управление состоянием, потоками данных и отказоустойчивостью
- Готовы писать на C++
Дополнительные требования
- Работали с Temporal или другой системой оркестрации
- Интересуетесь LLM и представляете, как они работают