Data Engineer NLP

Бюджет: не указан
Москва, Деловой центр, Деловой центр, Деловой центр, Деловой центр, Деловой центр
От 3 до 6 лет, Удаленная работа, Полная занятость
Дата публикации: 25.11.2025

Общее описание

Лаборатория искусственного интеллекта отвечает за внедрение технологий ИИ в бизнес-процессы банка. Мы занимаемся продуктовой аналитикой, разрабатываем модели машинного обучения для решения прикладных задач и развиваем собственную MLOps/AnalyticsOps‑платформу. На её основе создаются инструменты и фреймворки как для внутренних нужд Лаборатории, так и для специалистов по данным РСХБ.
Команда NLP фокусируется на разработке моделей и сервисов для обработки естественного языка, которые используются как в бизнес‑подразделениях, так и во внутренних ИТ-сервисах банка.

Сейчас в связи с активным расширением нам нужен Инженер данных.

Обязанности

  • Проектирование и разработка ETL и ELT потоков, витрин данных для моделей;
  • Очистка и стандартизация сырых данных, разработка проверок качества данных;
  • Осуществление переливки данных из источников в Озеро Данных;
  • Оптимизация и автоматизация процессов работы с данными;
  • Сопровождение существующих регламентов на Airflow;
  • Анализ и мониторинг производительности существующих запросов и их последующая оптимизация;
  • Внедрение современных практик и инженерных подходов;
  • Регулярное взаимодействие с Data Science и Data Analyst, ревью и валидация написанных запросов, помощь в оптимизации.

Требования

  • Продвинутые знания теории БД, SQL (PostgreSQL, PL/SQL), Python 3.8+, AirFlow, Pandas;
  • Опыт работы с распределенными хранилищами данных (Greenplum, Hadoop) и классический BigData стек (Hive/Impala, hdfs, PySpark);
  • Знание Python-библиотек для работы обработки данных;
  • Навыки работы с Jupyter (notebook, lab, hub) ;
  • Уверенное понимание Git и принципов разработки, базовое понимание CI/CD;
  • Знания различных типов архитектуры хранилищ, ETL/ELT-инструментов и принципов работы с данными;
  • Умение покрывать код и артефакты разработки документацией;
  • Английский, достаточный для чтения и понимания документации.

Будет плюсом:

  • Понимание принципов контейнеризации, базовые знания Docker/Kubernetes;
  • Опыт работы в команде вместе с DS и ML специалистами.

Мы предлагаем:

  • Обучение за счет компании (посещение конференций, курсов, помощь в написании статей на Хабр и т.д.);
  • Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы;
  • Забота о вашем здоровье: ДМС после испытательного срока, куда входит стоматология;
  • Гибкий график или полная удаленка (по итогам общения с командой);
  • Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Уфа, Новосибирск, Белгород и т.д.);
  • Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (Скидки на спортзалы, рестораны, маркетплейсы и т.д.).