← Все вакансии

SRE‑инженер в Yandex Crowd

Команда жизненного цикла исполнителей отвечает за наём, администрирование и операционное управление. Мы строим инфраструктуру для 30 000 удалённых исполнителей Yandex Crowd, управляем бизнес-процессами и автоматизируем их. В сферу нашей деятельности входит подбор и оформление сотрудников, обеспечение эффективной работы исполнителей, а также поддержка всех удалённых исполнителей сервиса. Кроме того, мы обеспечиваем поставку данных в DWH и делаем отчёты для продакт-менеджеров по основным показателям, касающимся работы исполнителей.

Задачи и обязанности

Проектирование и внедрение Infrastructure as Code (IaC)

Вы будете разрабатывать и внедрять решения для управления ИТ‑инфраструктурой через код, обеспечивая стандартизацию и повторяемость конфигураций.

Автоматизация развёртывания и управления инфраструктурой

Вам предстоит создавать и поддерживать инструменты и скрипты для упрощения и ускорения развёртывания сервисов, а также для эффективного управления ресурсами и конфигурациями.

Мониторинг и обеспечение надёжности систем

Вам нужно будет настраивать системы мониторинга, отслеживать ключевые метрики производительности и работоспособности сервисов, оперативно выявлять и устранять потенциальные проблемы, чтобы гарантировать высокую доступность и отказоустойчивость систем.

Больше о создании продуктов в Яндексе — в канале Yandex for Products

Требования

  • Знаете инструменты автоматизации и управления инфраструктурой (Terraform)
  • Умеете работать с системами мониторинга и логирования (Grafana)
  • Владеете навыками работы с контейнеризацией и оркестрацией (Docker, Kubernetes)
  • Знаете принципы построения высокодоступных и масштабируемых систем
  • Умеете писать скрипты на одном из языков программирования (Python, Bash, Java)
  • Хорошо разбираетесь в сетевых протоколах и основах сетевой инфраструктуры
  • Способны оперативно реагировать на возникающие проблемы и эффективно работать в условиях инцидентов
  • Готовы работать в режиме многозадачности и адаптироваться к меняющимся требованиям и условиям

Дополнительные требования

  • Работали с системами управления конфигурациями и версиями (Git, CI/CD‑системы)
  • Участвовали в построении систем резервного копирования и восстановления данных
  • Знаете облачные платформы (AWS, GCP, Yandex Cloud)
  • Знакомы с DevOps и принципами непрерывной доставки ПО
  • Обладаете знаниями в области кибербезопасности и умеете применять их на практике для защиты инфраструктуры
Python Java Docker Kubernetes Terraform AWS GCP CI/CD Grafana Yandex Cloud Git
Откликнуться →