Технический менеджер (управление эффективностью GPU-инфраструктуры Алисы AI)
Аудитория Алисы AI — более 30 миллионов активных пользователей в месяц. Для работы множества фич (от сложных LLM-агентов до генерации видео) мы задействуем гигантский парк GPU. В условиях мирового дефицита железа эффективность этого кластера — наш стратегический приоритет.
Ищем технического менеджера, которому предстоит решить нетривиальную задачу: построить целостную модель потребления GPU и выстроить прозрачный процесс capacity-планирования.
Задачи и обязанности
Аналитика и юнит-экономика
Вам предстоит связать метрики утилизации с экономикой: считать стоимость запроса и генерации, анализировать паттерны потребления и разрабатывать ROI-дашборды для топ-менеджмента. Для работы с сырыми данными, проверки гипотез и поиска узких мест нужно будет самостоятельно писать скрипты (Python, SQL). Мы приветствуем использование AI-ассистентов для решения этих задач.
Capacity Planning и автоматизация
Вы будете строить предиктивные модели потребности в GPU с учётом органического роста трафика и запуска новых фич, а также автоматизировать процессы финансового прогнозирования, чтобы полностью уйти от ручного распределения квот.
Координация и архитектура
Нужно будет выстроить прозрачный процесс приоритизации выдачи карт совместно с командой инфраструктуры Яндекса. Вы будете консультировать продуктовые команды по выбору оптимальных платформ и моделей видеокарт, управлять кросс-командными проектами оптимизации.
Больше о создании продуктов в Яндексе — в канале Yandex for Products
Требования
- Работали с большими объёмами данных: знание SQL — обязательно, владение Python — желательно (или готовы быстро выучить язык с помощью AI)
- Умеете находить паттерны и строить модели (будь то финансовые модели, архитектура системы или прогнозирование нагрузки)
- Выстраивали процессы: знаете, как взять хаос (или legacy) и превратить его в работающую, предсказуемую систему (например, занимались рефакторингом кода, выстраивали процессы в роли тимлида или запускали новые бизнес-процессы)
- Ориентированы на результат: не ждёте инструкций, а находите проблемы и решаете их, используя все доступные инструменты