← Все вакансии

Стажер Data Analyst в DataHouse [Big Data, МТС Веб Сервисы]

<1 дня на сайте
МТС / ООО МТС Веб Сервисы
Москва гибрид Работа в IT Junior
Откликнуться на сайте МТС / ООО МТС Веб Сервисы →

МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform. Big Data – один из ключевых юнитов МТС. Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде. DataHouse в Big Data – это целевой продукт по обеспечению компании коммунальными и экосистемными данными. Команда 2ЛТП занимается поддержкой всех процессов в хранилище данных от загрузки данных из многочисленных источников со всей экосистемы МТС до репликаций готовых витрин. Наш стек: Hadoop, Greenplum, Python, pyspark, Airflow, Gitlab.

Задачи и обязанности

  • Проводить диагностику по инцидентам качества данных;
  • Анализировать данные на кластере (EDA);
  • Анализировать логи ETL-процессов для выяснения причин сбоев;
  • Настраивать мониторинг качества данных;
  • Участвовать в разработке ETL и автоматизировать тестирование пайплайнов (опционально при желании развивать компетенции DE)

Требования

  • Студенты 3 и 4 курсов бакалавриата, специалитета или магистратуры;
  • Базовые знания SQL;
  • Опыт работы с данными на Python (например, pandas) на уровне базовых операций: чтение данных, агрегирование, соединение);
  • Будет плюсом: опыт разработки ETL-процессов, знание Git и уверенная работа с командной строкой.

Условия

  • Есть ли куратор? Да, наставник будет с тобой с самого начала;
  • Какой график? Гибкий, начало работы в промежутке с 8 до 11, занятость - 30 - 40 часов в неделю;
  • Условия? Официальное оформление сроком от 6 до 9 месяцев с реальной возможностью остаться в штате - такие кейсы уже проходили и нам понравилось :)