← Все вакансии

Технический менеджер (управление эффективностью GPU-инфраструктуры Алисы AI)

Аудитория Алисы AI — более 30 миллионов активных пользователей в месяц. Для работы множества фич (от сложных LLM-агентов до генерации видео) мы задействуем гигантский парк GPU. В условиях мирового дефицита железа эффективность этого кластера — наш стратегический приоритет.

Ищем технического менеджера, которому предстоит решить нетривиальную задачу: построить целостную модель потребления GPU и выстроить прозрачный процесс capacity-планирования.

Задачи и обязанности

Аналитика и юнит-экономика

Вам предстоит связать метрики утилизации с экономикой: считать стоимость запроса и генерации, анализировать паттерны потребления и разрабатывать ROI-дашборды для топ-менеджмента. Для работы с сырыми данными, проверки гипотез и поиска узких мест нужно будет самостоятельно писать скрипты (Python, SQL). Мы приветствуем использование AI-ассистентов для решения этих задач.

Capacity Planning и автоматизация

Вы будете строить предиктивные модели потребности в GPU с учётом органического роста трафика и запуска новых фич, а также автоматизировать процессы финансового прогнозирования, чтобы полностью уйти от ручного распределения квот.

Координация и архитектура

Нужно будет выстроить прозрачный процесс приоритизации выдачи карт совместно с командой инфраструктуры Яндекса. Вы будете консультировать продуктовые команды по выбору оптимальных платформ и моделей видеокарт, управлять кросс-командными проектами оптимизации.

Больше о создании продуктов в Яндексе — в канале Yandex for Products

Требования

  • Работали с большими объёмами данных: знание SQL — обязательно, владение Python — желательно (или готовы быстро выучить язык с помощью AI)
  • Умеете находить паттерны и строить модели (будь то финансовые модели, архитектура системы или прогнозирование нагрузки)
  • Выстраивали процессы: знаете, как взять хаос (или legacy) и превратить его в работающую, предсказуемую систему (например, занимались рефакторингом кода, выстраивали процессы в роли тимлида или запускали новые бизнес-процессы)
  • Ориентированы на результат: не ждёте инструкций, а находите проблемы и решаете их, используя все доступные инструменты
Python SQL LLM
Откликнуться →