
Site Reliability Engineer
- Lyon
- CDI
- Temps-plein
- 80% du footprint de l'infrastructure est distribué sur des serveurs Bare Metal
- Aucune délégation de nos services "régalien": Nos clusters de bases de données, plateforme de compute (Kubernetes), services de support (logging, monitoring, alerting ...) sont déployés et maintenus par l'équipe Infra.
- Observer, analyser et suivre le comportement des systèmes distribués de notre infrastructure afin de proposer des modifications à apporter pour en optimiser notre usage ;
- Suivre les changements et nouveautés des systèmes distribués & participer à leur évaluation et leur intégration dans notre stack technique ;
- Participer aux diverses tâches quotidiennes permettant le maintien de l'infrastructure et proposer des façons d'automatiser les tâches récurrentes ;
- Participer à l'élaboration de la roadmap technique de l'équipe Infra ;
- Participer, avec le reste de l'équipe technique, à l'architecture des nouvelles fonctionnalités.
Réseau : BGP, Routing avancé, VPN, NAT, Quagga, nftables
Stack : HAProxy, Debian, Kubernetes, Cilium, DirectPV, KeaDHCP, Docker, Kafka, etcd, Cassandra, MariaDB, Clickhouse, Redis, Proxmox, Consul, Traefik
IAC : Ansible, Pulumi, Terraform, ArgoCD
Monitoring : VictoriaMetrics, Tempo, Grafana, AlertManagerProfil recherché👉 Profil recherché
- Une première année (ou alternance) sur un poste similaire
- Développement d'outils avec un langage type Python, Go
- Expérience avec une solution d'infra as code (Terraform, Pulumi, Ansible)
- Experience avec Kubernetes pour la gestion de workload de production
- Familiarité avec les systèmes distribués
- Esprit d'équipe, volonté d'apprentissage et veille technique.
- First call avec
- Entretien avec
- Débrief avec l'équipe RH et offre pour rejoindre Batch ! 🙌
- Dispositif de soutien à la parentalité
- Solution de prévention santé mentale
- Coaching
- Afterworks, Déjeuners d'équipe, etc.
- Intéressement