Java-разработчик в AI Studio Yandex Cloud
Мы разрабатываем AI Search — набор технологий в рамках платформы AI Studio. Наши инструменты позволяют моделям генерировать ответы, опираясь на строго проверенные данные, будь то корпоративные документы или внешний интернет.
Система предоставляет два ключевых инструмента, которые могут работать одновременно:
- File Search — поиск по собственным данным пользователя (инструкции, PDF, FAQ)
- Web Search — поиск по выбранным доменам в интернете
Наши решения используются для создания голосовых агентов (через Realtime API) и текстовых ботов (Responses API).
Наша цель — сделать так, чтобы в контекст модели попадала только нужная, проверенная и актуальная информация, обеспечить высокое качество RAG-генерации (Retrieval Augmented Generation).
Мы ищем сильного инженера, который готов проектировать архитектуру сложных enterprise-решений и адаптировать классическую Java-разработку под динамичные требования AI-индустрии.
Задачи и обязанности
Разработка enterprise-бэкенда
Вам предстоит создавать надёжную серверную часть на Java со сложной бизнес-логикой для оркестрации поисковых агентов.
Архитектура и API
Вы будете проектировать удобные, расширяемые и безопасные REST- и gRPC-интерфейсы, через которые внешние клиенты взаимодействуют с AI Search.
Оптимизация и алгоритмы
Нужно будет решать задачи по ускорению поиска и фильтрации данных. Вам предстоит находить способы оптимизировать систему с учётом ограничений (latency, контекстное окно модели, нагрузка).
Адаптация AI-решений
В число ваших задач будет входить внедрение новых подходов, а также интеграция с современными моделями.
Больше о бэкенде в Яндексе — в канале Yandex for Backend
Требования
- Занимались промышленной разработкой на Java
- Оптимизировали производительность: умеете профилировать код, находить узкие места, оптимизировать работу с памятью и CPU
- Знакомы с базовыми алгоритмами и структурами данных, умеете применять их для решения проблем производительности, а не только на собеседованиях
- Умеете строить архитектуру сервисов так, чтобы они были поддерживаемыми и масштабируемыми
- Ответственны, адаптивны и способны оперативно погружаться в новые технологии (сфера ML/AI меняется очень быстро)
Дополнительные требования
- Строили RAG-платформы
- Работали с поисковыми движками или технологиями семантического поиска