В новую цифровую платформу с большим количеством интеграций ищем Backend Python разработчик/Data Engineer. Мы не строим DWH, мы собираем данные из большого количества API. Опыт с ETL Apache Airflow от 2 лет обязателен! Обязанности:
Разбор внешних API или парсинг данных и подготовка новых Dags в Airflow для загрузки данных
Поддержка существующих Dags в Airflow -оптмизация и рефакторинг. Работа с высоконагруженными микросервисами
Мониторинг и обработка ошибок в существующих интеграциях
Формирование таблиц для BI системы из внутренних источников данных
Работа по Data Quality загружаемых данных
Работа с PostgreSQL
Работа с шиной сообщений (NATS) для интеграции с внешними системами
Участие в выработке технических решений по ETL , декомпозиция бизнес и системных требований
Требования
Требования:
от 1+ года опыта в сфере Data Engineering.
Опыт работы с разнородными внешними API (Rest, GraphQL, парсинг данных)
Глубокие знания Python Продвинутый уровень SQL (PostgreSQL)
Опыт работы с ETL/ELT пайплайнами в production на Apache Airflow 2+ лет обязателен!
Опыт оптимизации Dags Airflow для высоконагруженных интеграций
Опыт работы с Data Quality данных
Опыт работы с шинами данных ( Kafka/Nats)
Желательно знание Golang
Понимание основных подходов проектирования ETL процессов и стека BigData
Опыт работы с Gitlab
Опыт использования Apache Spark
Опыт проектирования аналитических витрин
Понимание принципов и опыт работы с контейнеризацией (Kubernetes, Docker) CI/CD
Готовность решать сложные задачи, предлагать оптимальные архитектурные решения, работать с высоконагруженными системами.
Условия
Удаленный формат работы
Живой продукт с большим количеством интеграций (внешние площадки, агрегаторы)
127238, Г.Москва, внутригородская территория города федерального значения МУНИЦИПАЛЬНЫЙ ОКРУГ ТИМИРЯЗЕВСКИЙ, ПРОЕЗД 3-Й НИЖНЕЛИХОБОРСКИЙ, Д. 1А, ЭТАЖ 2, ПОМЕЩ. VIII, КОМ. 29