← Все вакансии

Системный аналитик данных (DWH)

Data Platform DWH позволяет главам продуктовых хранилищ Такси, Доставки и других сервисов, дата-партнёрам и инженерам понимать, что происходит с данными: отслеживать их использование, качество, актуальность и соблюдение SLA, контролировать стоимость расчёта и хранения и оптимизировать её.

Вам предстоит развивать продукт Data Platform DWH и отвечать за его ключевые функции. Для этого потребуется совмещать роли системного аналитика и инженера: проектировать метамодели, наполнять их данными, расширять и модернизировать инструмент для эффективного управления DWH. Вы будете работать с технологиями ClickHouse, YTsaurus, Greenplum, Flink, рассматривая их как предметную область и продукт для нашего DWH.

Если вы не боитесь сложных задач и готовы погрузиться в специфику разнородных систем хранения и обработки данных — приходите к нам.

Задачи и обязанности

Анализ требований и проектирование


Вы будете собирать и анализировать требования команд различных DWH, чтобы понять их боли и спроектировать метамодели, которые решат проблемы видимости и управляемости данных, позволят анализировать затраты на вычисления и хранение в DWH.

Разработка и визуализация


Вам предстоит реализовывать модели в ETL/ELT-процессах — от сбора данных до создания финальных витрин, а на основе витрин проектировать и строить дашборды в DataLens.

Больше об аналитике в Яндексе — в канале Yandex for Analytics

Требования

  • Умеете выявлять, декомпозировать и формализовать требования пользователей и технических команд
  • Понимаете принципы построения хранилищ данных, схемы «звезды», Data Vault, их плюсы и минусы
  • Отлично знаете SQL и разбираетесь в теории баз данных
  • Уверенно владеете Python для решения инженерных задач
  • Имеете опыт реализации ETL-процессов
  • Не боитесь трудных задач, готовы разбираться в устройстве систем хранения данных (ClickHouse, Greenplum, YTsaurus и других) и глубоко погружаться в сложные технические процессы, чтобы растить данные как продукт

Дополнительные требования

  • Проектировали или развивали крупные хранилища данных
  • Понимаете принципы мониторинга и обеспечения качества данных
  • Знакомы со стеком технологий Hadoop
  • Работали с системой визуализации данных DataLens или аналогами
Python SQL ClickHouse Vault Hadoop
Откликнуться →