Мы строим и поддерживаем платформу, объединяющую bare-metal серверы, контейнерные окружения и GPU-ресурсы для ML-нагрузок и высокопроизводительных вычислений.
Наша команда отвечает за устойчивость, производительность и управляемость всей платформы — от compute-узлов и сетевых сегментов до систем хранения и мониторинга.
Инженер в нашей команде — это человек, который понимает, как живёт Linux под нагрузкой, умеет анализировать причины деградаций, автоматизировать эксплуатационные процессы и поддерживать инфраструктуру в стабильном и предсказуемом состоянии.
Наш стек:
Linux (Ubuntu, Debian), Proxmox, pfSense, Ansible, rsyslog, Prometheus, Grafana, Zabbix, ELK, Docker, WireGuard, ZFS, LVM, GitLab CI