SRE-инженер в Яндекс Афишу
Яндекс Афиша — ведущий онлайн-сервис по продаже билетов в России. Мы также развиваем и зарубежное направление. Предлагаем широкий выбор мероприятий: концерты, театральные представления, спортивные события и многое другое. Предоставляем полный комплекс услуг для партнёров и удобный сервис для пользователей, в том числе покупку, возврат билетов и обмен впечатлениями. Мы ищем SRE‑инженера или разработчика инфраструктуры с опытом в эксплуатации.
Стек эксплуатации:
- Приложения — Java, Kotlin, Node.js, Go
- Хранилища — MongoDB, PostgreSQL, Redis, YT
- Инструменты — Python, Go, Trivy, Infractl, ArcadiaCI, YQL, Yandex Monitoring, Kubernetes, DataLens
- Паттерны и практики — IaC, ArchOps, SLO, ServiceMesh, L3 + L7, ZBP
Задачи и обязанности
Повышение надёжности продуктов
Вы будете работать над поддержанием высокого качества продуктов: улучшать observability, проводить SLO-ревью, выстраивать систему управления инцидентами — от координации решения проблем в продакшене до анализа метрик работы команд после инцидентов (постмортема). Также вам предстоит участвовать в устранении неполадок на высоконагруженном продакшене.
Оптимизация инфраструктуры
Вам предстоит разрабатывать инструменты для эффективной утилизации ресурсов продукта, искать и устранять узкие места, заказывать серверные мощности в облаке, строить безопасную инфраструктуру и участвовать во внедрении практик безопасной разработки ПО.
Автоматизация доставки
Вы будете повышать качество и скорость CD артефактов в релизах, новых сервисах и unstable-окружениях для сервисов на пул-реквест. Также вам предстоит участвовать в организации CD-инфраструктуры в IaC, писать скрипты и автоматизировать процессы.
Больше о разработке в Яндексе — в канале Yandex for Developers
Требования
- Работали с системами управления конфигурациями и оркестраторами (Y.Deploy, K8s, Terraform, хостовые конфигурации, Infractl)
- Занимались командной разработкой на Python/Go, работали с ООП, писали тесты
- Выстраивали CI/CD — от написания кода до деплоя в продакшен
- Работали с UNIX‑системами и консолью
- Понимаете принципы работы современных распределённых веб‑приложений
- Готовы и хотите активно развиваться, изучать новые технологии и инструменты
Дополнительные требования
- Работали в Cloud Engineering: занимались организацией инфраструктуры, её эксплуатацией и траблшутингом
- Проектировали и эксплуатировали распределённые системы 24/7/365
- Занимались оптимизацией и траблшутингом СУБД (PostgreSQL, MongoDB)
- Диагностировали процессы: интерпретация вывода ps, top, strace, perf, tcpdump
- Знаете сетевые протоколы и основы маршрутизации
- Понимаете, как пользовательские приложения взаимодействуют с операционной системой
- Знаете принципы работы генеративного ИИ и NLP
Похожие вакансии