Стажер Data Analyst в DataHouse [Big Data, МТС Веб Сервисы]
<1 дня на сайтеМТС Web Services (MWS) — бигтех-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform. Big Data – один из ключевых юнитов МТС. Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде. DataHouse в Big Data – это целевой продукт по обеспечению компании коммунальными и экосистемными данными. Команда 2ЛТП занимается поддержкой всех процессов в хранилище данных от загрузки данных из многочисленных источников со всей экосистемы МТС до репликаций готовых витрин. Наш стек: Hadoop, Greenplum, Python, pyspark, Airflow, Gitlab.
Задачи и обязанности
- Проводить диагностику по инцидентам качества данных;
- Анализировать данные на кластере (EDA);
- Анализировать логи ETL-процессов для выяснения причин сбоев;
- Настраивать мониторинг качества данных;
- Участвовать в разработке ETL и автоматизировать тестирование пайплайнов (опционально при желании развивать компетенции DE)
Требования
- Студенты 3 и 4 курсов бакалавриата, специалитета или магистратуры;
- Базовые знания SQL;
- Опыт работы с данными на Python (например, pandas) на уровне базовых операций: чтение данных, агрегирование, соединение);
- Будет плюсом: опыт разработки ETL-процессов, знание Git и уверенная работа с командной строкой.
Условия
- Есть ли куратор? Да, наставник будет с тобой с самого начала;
- Какой график? Гибкий, начало работы в промежутке с 8 до 11, занятость - 30 - 40 часов в неделю;
- Условия? Официальное оформление сроком от 6 до 9 месяцев с реальной возможностью остаться в штате - такие кейсы уже проходили и нам понравилось :)