
Lead Data Engineer H/F
- Paris
- CDI
- Temps-plein
- Concevoir, construire et maintenir une infrastructure de données évolutive et performante pour répondre aux besoins de l'entreprise.
- Définir et mettre en œuvre les meilleures pratiques pour l'architecture des données, le stockage et les pipelines de traitement.
- Optimiser l'ingestion, la transformation et l'activation des données pour garantir l'efficacité et la scalabilité.
- Piloter la stratégie des entrepôts de données et des data lakes, en assurant une intégration fluide des données structurées et non structurées.
- Diriger le développement des workflows ETL en utilisant des outils comme Airflow, dbt, Apache Spark ou KaWa.
- Implémenter et gérer des pipelines de traitement des données en batch et en temps réel.
- Améliorer la fiabilité, la qualité et l'accessibilité des données grâce à une surveillance et des journaux robustes.
- Développer et faire respecter les politiques de gouvernance des données, en assurant la conformité avec les normes de sécurité et de confidentialité (RGPD).
- Utiliser les services cloud pour un traitement et un stockage des données évolutifs.
- Optimiser les coûts d'infrastructure tout en maintenant une haute disponibilité et performance.
- Rechercher et implémenter des technologies émergentes pour améliorer les capacités de traitement et d'analyse des données.
- Définir les objectifs de l'équipe, les feuilles de route et les délais de livraison en collaboration avec les parties prenantes.
- Favoriser l'amélioration continue des workflows, de l'automatisation et de la documentation.
- 5+ ans d'expérience en Data Engineering, dont au moins 1-2 ans dans un rôle de leadership.
- Diplôme de bachelor ou master en informatique, génie, Data Science ou un domaine connexe.
- Maîtrise de Python, SQL et des outils d'orchestration des données tels qu'Apache Airflow et Airbyte.
- Expérience avec les systèmes de gestion de bases de données comme PostgreSQL et Snowflake, ainsi qu'une solide connaissance de la modélisation des entrepôts de données.
- Connaissance des outils de transformation des données comme dbt.
- Expérience pratique avec les plateformes cloud, incluant la gestion des services de données.
- Expertise en qualité des données, gouvernance des données et bonnes pratiques de gestion des données.
- Expérience en Data Science ou industrialisation du Machine Learning (ML) est un plus.
- Familiarité avec des outils comme Metabase, Hightouch, Secoda et Terraform est un atout.
- Excellentes compétences en résolution de problèmes et capacité à penser de manière créative pour relever les défis du Data Engineering.
- Esprit collaboratif, capable de co-construire des solutions avec d'autres équipes techniques et métiers.
- Solides compétences organisationnelles et en gestion de projet, avec la capacité de gérer des projets efficacement tout en respectant les délais et objectifs.
- Expérience de travail avec l'IA et les modèles linguistiques de grande taille (LLMs).
- Expertise en solutions de gouvernance des données et mise en œuvre des meilleures pratiques à travers les équipes techniques.
- Familiarité avec les pipelines CI/CD et l'automatisation des déploiements.