DevOps/SRE инженер (Лаборатория данных)
- Москва
- Постоянная работа
- Полная занятость
- развертывание новых компонентов платформы и/или обновление существующих по всем стендам , как на выделенных VM, так и в контейнерах (OpenShift);
- обеспечение работоспособности платформы / Устранение сбоев и расследование их причин;
- настройка мониторинга платформы (Prometheus, Grafana, Zabbix), внедрение политики эффективного уведомления команды о критичных событиях;
- обслуживание инфраструктуры (установка патчей, изменение конфигов, закрытие обнаруженных уязвимостей и т.д.);
- оптимизация инфраструктуры: улучшение производительности и отказоустойчивости инфраструктуры, оптимизация существующих процессов и инструментов, повышение качества обслуживания наших внутренних клиентов;
- внедрение SRE-практик для улучшения качества управления инфраструктурой;
- построение и улучшение devops-конвейеров для развертывание инфраструктуры, прикладного кода и конфигураций;
- внедрение лучших CI/CD практик;
- консультации разработчиков и смежных групп поддержки, выстраивание процессов по управлению инфраструктурой платформы;
- разработка и поддержка внутренних инструментов автоматизации, оптимизация существующих;
- участие в планировании архитектуры платформы, составление прогнозов по нагрузке;
- взаимодействие с разработчиками, 2ЛС (дежурной сменой) и сисадминами, координация команд по смежным областям.
- опыт работы DevOps инженером/SRE от 2-х лет;
- уверенное владение Jenkins (написание и оптимизация Groovy-пайплайнов);
- опыт работы с Ansible для управления конфигурациями;
- опыт работы с Bitbucket, SonarQube, Nexus;
- навыки работы с git (branching, merging, git flow);
- знание Python;
- уверенное знание Linux (администрирование, bash), знакомство с сетевыми технологиями в области серверной инфраструктуры;
- опыт работы с системами мониторинга и централизованного логирования (Prometheus, Zabbix, Grafana, Elastic);
- глубокое понимание и опыт работы с технологиями контейнеризации (Docker/Podman, Kubernetes/OpenShift);
- навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом.
- опыт построения SRE в команде с нуля;
- знание Helm;
- знание Hashicorp Vault;
- опыт настройки Istio Service Mesh;
- опыт работы с СУБД (Greenplum, Clickhouse), Airflow, Trino.
- гибридный/офисный формат работы (опционально)
- годовой бонус и ежегодный пересмотр
- расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
- корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
- офис на Кутузовской с видом на набережную, зонами отдыха и спортзалом
- 90 дней удаленной работы из любого региона РФ (не применимо для сопровождения)
- льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.
Хабр Карьера