Общее описание

Технократия цифровизирует бизнес: от небольших компаний до крупных корпораций. СИБУР Диджитал, Камаз Digital, Татнефть, Университет Иннополис — наши клиенты. А ещё внутренние продукты, которые мы выводим на рынок.

Ищем в нашу команду AI/ML Инженера на проект зарубежного финтеха.

Стек технологий:

Python 3.12+, asyncio
FastAPI, Uvicorn
Pydantic v2
LiteLLM
vLLM, TGI, Ollama
LangChain, LlamaIndex
Qdrant, Chroma, Pinecone
Sentence-Transformers, OpenAI Embeddings
Unstructured
Chonkie, LangChain Text Splitters
FlashRank, Cohere
Presidio
NeMo Guardrails
Detoxify
OpenLLMetry
LangFuse / LangSmith
Prometheus
Docker, Kubernetes
CUDA, GPU (A10, A100)
MinIO

Чем предстоит заниматься:

Разрабатывать LLM routing и gateway слой
Реализовывать и оптимизировать RAG-пайплайны
Встраивать guardrails и AI safety механизмы
Интегрировать LLM observability и трейсинг
Оптимизировать inference по latency, throughput и стоимости
Реализовывать evaluation-пайплайны качества ответов
Работать с GPU-инфраструктурой и масштабированием

Что мы ожидаем:

Опыт AI Engineering или MLOps от 3 лет
Продуктовый опыт работы с LLM
Глубокое понимание RAG-архитектур
Уверенная работа с Python и async-стеком
Понимание рисков и безопасности LLM-систем

Будет плюсом:

Agentic RAG и multi-agent системы
Fine-tuning моделей (LoRA, QLoRA)
Multi-modal модели (vision, audio)
ASR, TTS, OCR, NER
Опыт evaluation-фреймворков (RAGAS, deepeval)
Оптимизация inference (batching, KV-cache, quantization)

Откликнуться

Общее описание

ITS

Адрес

AI/ML Engineer (Python)

Общее описание

ITS

Адрес