Задачи Обслуживание, поддержка и развитие продуктовой инсталляции (экосистема Openstack) Автоматизация рутинных действий Поддержка и доработка внутренних решений SRE Участие в инцидент-менеджменте (траблшутинг, помощь разработке и L2/L1, работа с постмортемами) On-call дежурства по продуктовой среде L3-поддержка пользователей Поддержка и развитие внутренних сервисов (DB - MariaDB + Galera + ProxySQL /PosrgreSQL + Stolon, VictoriaMetrics, AlertManager, Elastic + пайплайны доставки логов и метрик, Ceph) Доставка новых релизов для инфраструктурных компонентов на продуктовую инсталляцию Поддержка и развитие интеграционной среды Требования Опыт работы системным администратором / SRE-инженером от трёх лет Опыт обслуживания Linux-систем от трёх лет (оптимально на базе CentOS/RedOS) Опыт работы с OpenStack в качестве администратора от года Опыт построения мониторинга и алертинга для сложных ИС (Grafana, Zabbix, VictoriaMetrics, AlertManager) Прикладные навыки автоматизации с использованием Ansible/Terraform Прикладные навыки автоматизации на Bash/Python/Go Опыт построения технического SLA для сервисов (выбор SLI и выставление оптимальных SLO) Навыки обслуживания и администрирования DBMS - MariaDB + Galera/PostgreSQL + Stolon Навыки работы и настройки геораспределённых ИС (BGP, VxLAN, EVPN, OVS) Будет плюсом Опыт обслуживания Ceph Построение и внедрение стандартов мониторинга, алертинга; построение эффективных пайплайнов доставки логов/метрик (у нас ~70M точек в час, ~12K docs в час) Опыт работы в продуктовой команде