ML Engineer (Machine Learning / AI / Data Pipelines / Real-time Analytics)

Уровень зарплаты: от 600 000 ₸ до 700 000 ₸
Астана
От 3 до 6 лет, Полный день, Полная занятость
Дата публикации: вчера с сайта hh.ru

Общее описание

О проекте:

Мы создаём интеллектуальный модуль анализа и прогнозирования данных в составе системы автоматизации портовой инфраструктуры. Модуль обрабатывает миллионы событий в реальном времени, обучает модели, выявляет аномалии, оптимизирует процессы и помогает системе принимать решения автоматически.

Основные задачи:

  • Разработка и обучение ML-моделей для классификации, прогнозирования и детекции аномалий.
  • Построение end-to-end ML-пайплайнов: сбор → обработка → feature engineering → обучение → деплой.
  • Работа с потоковыми данными (Kafka / MQTT) и реализация моделей в real-time режиме.
  • Интеграция ML-модулей с backend-микросервисами (REST / gRPC).
  • Оптимизация производительности моделей и inference.
  • Настройка мониторинга моделей (MLOps, drifts, метрики качества).
  • Разработка сервисов предиктивной аналитики и автоматизации планирования.
  • Подготовка датасетов, валидация данных, контроль качества.
  • Взаимодействие с backend-командой для внедрения вычислительных модулей в инфраструктуру.

Технический стек:

  • Python 3.10+, FastAPI
  • pandas, numpy, scikit-learn, PyTorch / TensorFlow
  • Airflow / Prefect / Dagster
  • Kafka / RabbitMQ, Redis
  • Docker, Kubernetes, CI/CD
  • Grafana, Prometheus, ELK для мониторинга
  • MLflow / Weights & Biases для экспериментов и трекинга моделей

Требования

  • Опыт коммерческой работы с ML от 2–3 лет.
  • Уверенные навыки Python и ML-библиотек (sklearn, PyTorch/TensorFlow).
  • Опыт построения полноценного ML-пайплайна.
  • Опыт работы с потоковыми данными или большими датасетами.
  • Понимание MLOps-подходов: деплой моделей, мониторинг, обновление.
  • Понимание алгоритмов машинного обучения, статистики и feature engineering.
  • Умение документировать решения, писать чистый и структурированный код.

Будет плюсом:

  • Опыт с системами реального времени (Kafka/MQTT).
  • Работа с компьютерным зрением или обработкой видео.
  • Опыт предиктивной аналитики в промышленности / логистике.
  • Работа с BI-инструментами (Grafana, PowerBI).
  • Опыт оптимизации inference (ONNX, TensorRT, quantization).

Условия

  • Уровень — Middle / Middle+ / Senior.
  • Формат — оффлайн.
  • Занятость — полная.