SRE Network BareMetal

OVHcloud

  • Paris
  • CDI
  • Temps-plein
  • Il y a 1 mois
SRE Network BareMetal H/F/NAu sein de votre équipe #OneTeamAu sein du groupe Infrastructure, rejoindre l'équipe en charge de soutenir l'ambition et la croissance d'OVHcloud en mettant à l'échelle, déployant, opérant et gérant toutes les infrastructures réseau, tout en supportant les services réseau associés.En tant que Site Reliability Engineer, vous contribuerez à construire une plateforme résiliente, scalable et efficiente en réduisant les coûts opérationnels et en favorisant l'excellence des services.Vos principales responsabilités
  • Évaluer et prioriser les incidents affectant l'infrastructure et les plateformes logicielles d'OVHcloud
  • Dépanner les problèmes techniques complexes et coordonner les efforts interfonctionnels pour les résoudre
  • Proposer et mettre en œuvre les meilleures pratiques pour garantir que les incidents sont traités de manière permanente et ne se reproduisent pas
  • Participer aux rotations d'astreinte pour assurer la continuité des services
  • Collaborer avec les équipes de développement et d'infrastructure pour éliminer les goulots d'étranglement, améliorer les performances et réduire les coûts opérationnels
  • Contribuer aux revues post-incidents et aux post-mortems
  • Fournir un support technique aux propriétaires d'applications et aux parties prenantes des pipelines CI/CD
  • Travailler dans un environnement d'infrastructure IT fortement orienté réseau
Votre futur impactDans 6 mois
  • Vous gérerez les incidents de manière autonome, en apportant des solutions concrètes et durables. Vous aurez contribué activement aux astreintes et maîtrisé nos outils de monitoring.
  • Vous aurez identifié et commencé à résoudre des points faibles précis de l'infrastructure, notamment via des automatisations en Python ou Go.
  • Vous serez un membre essentiel de l'équipe, apportant votre expertise lors des revues post-incidents et soutenant les équipes applicatives.
Et dans 1 an
  • Vous piloterez des projets majeurs pour améliorer la performance et réduire les coûts, en intégrant des solutions SRE avancées et en étant un référent technique.
  • Vos contributions auront un impact direct sur la stratégie d'infrastructure. Vous partagerez votre savoir et contribuerez à faire évoluer les pratiques d'excellence au sein d'OVHcloud.
  • Vous maîtriserez en profondeur l'écosystème réseau et logiciel, capable de résoudre les défis les plus complexes et de proposer des améliorations structurelles.
Compétences requises :
  • Vous maîtrisez l'anglais et le français, tant à l'écrit qu'à l'oral
  • Vous avez une solide connaissance des systèmes internes Unix/Linux
  • Vous êtes compétent en développement logiciel (Python, Go, Perl)
  • Vous avez de l'expérience dans l'exploitation de systèmes distribués
  • Vous êtes familier avec les technologies de conteneurisation (Docker, Kubernetes)
  • Vous avez une bonne compréhension des outils, plateformes et processus liés au CI/CD/CA
  • Vous avez une expérience pratique avec les pipelines de données et les systèmes de messagerie/pub-sub (RabbitMQ, Redis, Kafka)
  • Vous avez une bonne connaissance des outils de monitoring (Prometheus, Grafana) et des meilleures pratiques associées
  • Vous faites preuve d'un solide esprit d'analyse et d'une capacité à résoudre des problèmes complexes.
  • Vous possédez d'excellentes compétences en communication et en collaboration d'équipe
  • Vous êtes enthousiaste à l'idée de travailler sur des infrastructures à grande échelle et à haute disponibilité
C'est un +
  • Vous êtes à l'aise avec les réseaux (la connaissance de VXLAN est un atout)
PROCESS DE RECRUTEMENT1. Échange avec notre Talent Acquisition Specialist: Magali2. Entretien avec le Manager: Olivier3. Rencontre possible avec l'équipe ou un pairCompte Épargne Temps (CET)
Intéressement
Plan d’Épargne de Groupe (PEG)
Plan d’Épargne pour la Retraite Collectif (PERCO)Carte Ticket Restaurant
RTT
Mutuelle et prévoyance d’entreprise*
Service d’accompagnement aux Risques-Psycho-Sociaux via une plateforme dédiée*
Subventions sport & vacances
  • pour tous les membres d’un même foyer
REJOINDRE L'AVENTURE OVHCLOUDOVHcloud valorise la diversité des personnes qu’elle embauche et accompagne. La diversité pour nous, c’est favoriser un milieu de travail où les différences individuelles sont reconnues, appréciées et respectées de façon à développer le plein potentiel et les forces de chacune et chacun.
Soyez libre d’être vous-même !LE DÉVELOPPEMENT DURABLE CHEZ OVHCLOUD, UN ENGAGEMENT PROFONDLa data a un impact fort dans tous les aspects de notre vie. Elle change aussi notre manière de concevoir le monde et son usage reflète le type de société dans laquelle nous voulons vivre.
En tant qu’acteur majeur de la tech, nous faisons tout ce qui est en notre pouvoir depuis plus de 20 ans pour réduire notre impact environnemental grâce à l’innovation industrielle et pour garantir un cloud libre #SustainableByDesign🔗POUR ALLER PLUS LOINDécouvrez nos collaboratrices et collaborateurs passionné(e)s et explorez leurs métiers chez OVHcloud!Vous voulez contribuer à des projets uniques pour construire ensemble le cloud libre ? Allons-y ! Chez OVHcloud, nous sommes animés par la même volonté, celle de construire l’avenir ensemble pour défendre la liberté d’innover.🔗VOTRE MISSIONSRE Network BareMetal H/F/NAu sein de votre équipe #OneTeamAu sein du groupe Infrastructure, rejoindre l'équipe en charge de soutenir l'ambition et la croissance d'OVHcloud en mettant à l'échelle, déployant, opérant et gérant toutes les infrastructures réseau, tout en supportant les services réseau associés.En tant que Site Reliability Engineer, vous contribuerez à construire une plateforme résiliente, scalable et efficiente en réduisant les coûts opérationnels et en favorisant l'excellence des services.Vos principales responsabilités
  • Évaluer et prioriser les incidents affectant l'infrastructure et les plateformes logicielles d'OVHcloud
  • Dépanner les problèmes techniques complexes et coordonner les efforts interfonctionnels pour les résoudre
  • Proposer et mettre en œuvre les meilleures pratiques pour garantir que les incidents sont traités de manière permanente et ne se reproduisent pas
  • Participer aux rotations d'astreinte pour assurer la continuité des services
  • Collaborer avec les équipes de développement et d'infrastructure pour éliminer les goulots d'étranglement, améliorer les performances et réduire les coûts opérationnels
  • Contribuer aux revues post-incidents et aux post-mortems
  • Fournir un support technique aux propriétaires d'applications et aux parties prenantes des pipelines CI/CD
  • Travailler dans un environnement d'infrastructure IT fortement orienté réseau
Votre futur impactDans 6 mois
  • Vous gérerez les incidents de manière autonome, en apportant des solutions concrètes et durables. Vous aurez contribué activement aux astreintes et maîtrisé nos outils de monitoring.
  • Vous aurez identifié et commencé à résoudre des points faibles précis de l'infrastructure, notamment via des automatisations en Python ou Go.
  • Vous serez un membre essentiel de l'équipe, apportant votre expertise lors des revues post-incidents et soutenant les équipes applicatives.
Et dans 1 an
  • Vous piloterez des projets majeurs pour améliorer la performance et réduire les coûts, en intégrant des solutions SRE avancées et en étant un référent technique.
  • Vos contributions auront un impact direct sur la stratégie d'infrastructure. Vous partagerez votre savoir et contribuerez à faire évoluer les pratiques d'excellence au sein d'OVHcloud.
  • Vous maîtriserez en profondeur l'écosystème réseau et logiciel, capable de résoudre les défis les plus complexes et de proposer des améliorations structurelles.
Compétences requises :
  • Vous maîtrisez l'anglais et le français, tant à l'écrit qu'à l'oral
  • Vous avez une solide connaissance des systèmes internes Unix/Linux
  • Vous êtes compétent en développement logiciel (Python, Go, Perl)
  • Vous avez de l'expérience dans l'exploitation de systèmes distribués
  • Vous êtes familier avec les technologies de conteneurisation (Docker, Kubernetes)
  • Vous avez une bonne compréhension des outils, plateformes et processus liés au CI/CD/CA
  • Vous avez une expérience pratique avec les pipelines de données et les systèmes de messagerie/pub-sub (RabbitMQ, Redis, Kafka)
  • Vous avez une bonne connaissance des outils de monitoring (Prometheus, Grafana) et des meilleures pratiques associées
  • Vous faites preuve d'un solide esprit d'analyse et d'une capacité à résoudre des problèmes complexes.
  • Vous possédez d'excellentes compétences en communication et en collaboration d'équipe
  • Vous êtes enthousiaste à l'idée de travailler sur des infrastructures à grande échelle et à haute disponibilité
C'est un +
  • Vous êtes à l'aise avec les réseaux (la connaissance de VXLAN est un atout)

OVHcloud