SRE‑инженер в Yandex Crowd
Команда жизненного цикла исполнителей отвечает за наём, администрирование и операционное управление. Мы строим инфраструктуру для 30 000 удалённых исполнителей Yandex Crowd, управляем бизнес-процессами и автоматизируем их. В сферу нашей деятельности входит подбор и оформление сотрудников, обеспечение эффективной работы исполнителей, а также поддержка всех удалённых исполнителей сервиса. Кроме того, мы обеспечиваем поставку данных в DWH и делаем отчёты для продакт-менеджеров по основным показателям, касающимся работы исполнителей.
Задачи и обязанности
Проектирование и внедрение Infrastructure as Code (IaC)
Вы будете разрабатывать и внедрять решения для управления ИТ‑инфраструктурой через код, обеспечивая стандартизацию и повторяемость конфигураций.
Автоматизация развёртывания и управления инфраструктурой
Вам предстоит создавать и поддерживать инструменты и скрипты для упрощения и ускорения развёртывания сервисов, а также для эффективного управления ресурсами и конфигурациями.
Мониторинг и обеспечение надёжности систем
Вам нужно будет настраивать системы мониторинга, отслеживать ключевые метрики производительности и работоспособности сервисов, оперативно выявлять и устранять потенциальные проблемы, чтобы гарантировать высокую доступность и отказоустойчивость систем.
Больше о создании продуктов в Яндексе — в канале Yandex for Products
Требования
- Знаете инструменты автоматизации и управления инфраструктурой (Terraform)
- Умеете работать с системами мониторинга и логирования (Grafana)
- Владеете навыками работы с контейнеризацией и оркестрацией (Docker, Kubernetes)
- Знаете принципы построения высокодоступных и масштабируемых систем
- Умеете писать скрипты на одном из языков программирования (Python, Bash, Java)
- Хорошо разбираетесь в сетевых протоколах и основах сетевой инфраструктуры
- Способны оперативно реагировать на возникающие проблемы и эффективно работать в условиях инцидентов
- Готовы работать в режиме многозадачности и адаптироваться к меняющимся требованиям и условиям
Дополнительные требования
- Работали с системами управления конфигурациями и версиями (Git, CI/CD‑системы)
- Участвовали в построении систем резервного копирования и восстановления данных
- Знаете облачные платформы (AWS, GCP, Yandex Cloud)
- Знакомы с DevOps и принципами непрерывной доставки ПО
- Обладаете знаниями в области кибербезопасности и умеете применять их на практике для защиты инфраструктуры
Похожие вакансии