
Ingénieur fiabilité (F/H)
- Deux-Sèvres
- CDI
- Temps-plein
L'ingénieur(e) fiabilité met en œuvre des compétences sur la performance applicative et l'administration système. Son rôle principal est d'assurer la fiabilité, la disponibilité, la performance et la sécurité des systèmes informatiques en production.Responsabilités principales :Analyse et Optimisation de la Performance:- Analyser les performances des systèmes existants et identifier les axes d'amélioration.
- Proposer et mettre en œuvre des solutions pour optimiser la fiabilité, la disponibilité et la scalabilité de nos infrastructures.
- Définir et suivre les indicateurs de performance clés (SLO, SLA, SLI) et mettre en place des alertes proactives.
- Définir la Stratégie de Résilience :
- Analyser nos architectures applicatives pour identifier et éliminer les points de défaillance uniques (SPOF).
- Définir et suivre les Objectifs de Niveau de Service (SLO) et les Indicateurs de Niveau de Service (SLI) pour nos applications critiques.- Collaborer avec les architectes de solution pour promouvoir et intégrer des principes d'architecture résilients.
- Établir et Diffuser les Bonnes Pratiques :
- Rédiger et maintenir le guide des bonnes pratiques de fiabilité et de résilience pour le développement (build) et l'exploitation (run).
- Définir les standards pour le monitoring, le logging et l'alerting, en veillant à leur pertinence et à leur efficacité.
- Accompagner les Équipes et Promouvoir la Culture de la Fiabilité :
- Agir en tant que coach et référent technique auprès des équipes de développement et d'ops.
- Animer des revues d'architecture pour garantir que les principes de résilience sont appliqués dès la phase de conception.
- Piloter des analyses post-mortem après les incidents, en assurant le suivi des actions d'amélioration.
- Organiser des sessions de formation et des ateliers pratiques, et définir des tests proactifs afin d'assurer la robustesse de nos systèmes.Intégrer une Vision d'Architecte de Production :
Assurer une veille technologique sur les outils et les pratiques émergentes en matière de fiabilité (SRE) et de résilience.Description du profil recherchéVotre profil :
- De formation supérieure Bac+5 ou une expérience d'au moins 5 ans dans les métiers de la fiabilité/SRE.
- Vous avez une expérience significative en tant qu'Ingénieur Fiabilité (SRE), Ingénieur DevOps, Architecte de Production ou dans un rôle similaire axé sur la fiabilité des systèmes distribués.
- Excellente maîtrise des environnements Cloud (AWS, GCP ), notamment des services liés à la haute disponibilité et à la scalabilité.
- Expérience avec les technologies de conteneurisation
- Maîtrise des outils de monitoring et d'observabilité (Dynatrace, splunk, Service Pilote, etc.).
- Compétences en développement (Java, Powershell,Bash, … ).
- Connaissance des principes de l'Infrastructure as Code (Terraform, Ansible).
- Capacité à concevoir des solutions robustes, scalables et résilientes.
- Vision systémique et capacité à analyser des architectures complexes.
- Bon communicant, pédagogue et capable de vulgariser des concepts techniques complexes.
- Leadership naturel et capacité à influencer sans autorité hiérarchique.
- Culture de l'amélioration continue et une approche pragmatique de la résolution de problèmes.
- Rigueur, organisation et autonomie.