Lead Data Scientist R&D (H / F)

Servier

Suresnes, Hauts-de-Seine
CDI
Temps-plein

Il y a 25 jours

Fondé pour servir la santé, Servier est un groupe pharmaceutique international gouverné par une Fondation, qui aspire à avoir un impact sociétal significatif pour les patients et pour un monde durable. Son modèle unique de gouvernance lui permet de servir pleinement sa vocation avec une vision à long terme : être engagé pour le progrès thérapeutique au bénéfice des patients. Les 21 800 collaborateurs qui composent le Groupe sont engagés autour de cette vocation commune, source d'inspiration au quotidien. Leader mondial en cardiologie, Servier a pour ambition de devenir un acteur reconnu, focalisé et innovant en oncologie en ciblant des cancers difficiles à traiter. C'est pourquoi le Groupe consacre plus de 50 % de son budget de R&D au développement de thérapies ciblées et innovantes en oncologie. Les neurosciences et les maladies immuno-inflammatoires constituent un futur relais de croissance. Dans ces domaines, Servier se focalise sur un nombre restreint de pathologies spécifiques dans lesquelles une caractérisation précise des patients permet de proposer une réponse thérapeutique ciblée, grâce à la médecine de précision. Pour favoriser l'accès à des soins de qualité pour tous, et à moindre coût, le Groupe propose également une offre de médicaments génériques couvrant la majorité des pathologies, en s'appuyant sur des marques fortes en France, en Europe de l'Est, au Brésil et au Nigeria. Dans tous ces domaines, le Groupe intègre la voix du patient à chaque étape du cycle de vie du médicament. Servier, dont le siège social est basé en France, s'appuie sur une solide implantation géographique dans plus de 150 pays et a réalisé, en 2021, un chiffre d'affaires de 4,7 milliards d'euros.Le Groupe Servier mène une transformation digitale ambitieuse avec un objectif clair de devenir « best in class Digital Performer ». La Data Factory joue un rôle central dans cette ambition et a un impact fort à chaque étape de la chaine de valeur. Depuis la recherche de nouvelles molécules, la prédiction de leur comportement, l'analyse d'efficacité des traitements en passant par l'optimisation des processus de production des médicaments, la gestion des stocks et la prévision des ruptures jusqu'à l'approche omnicanale et personnalisée auprès des professionnels de santé, le suivi des patients… : tous ces enjeux s'appuient sur la Data et sa puissance transformante.Rattaché(e) à la Direction Digital, Data & IS, la Data Factory œuvre pour rendre les données accessibles, les valoriser à travers des produits data métiers à base d'IA et d'Advanced Analytics, et transformer Servier en un groupe orientée data (« Data-driven ») où tous les collaborateurs connaissent les enjeux de la data.La création des produits Data s'appuie sur une « plateforme Data» centrale, cloud-native, sécurisée et performante avec les technologies les plus avancées. Servier a établi un partenariat stratégique de cinq années avec Google Cloud, lui donnant accès à des technologies innovantes et des liens privilégiés avec Google Cloud, et permettant de disposer d'une puissance de calcul augmentée, d'accélérer l'analyse et de développer l'innovation sur de nombreux défis business et technologiques.Au sein de la Data Factory, le pôle Data Science a pour mission d'accélérer la conception et déploiement des solutions de machine learning et intelligence artificielle. Cela se fait à travers le développement et partage des expertises en différents sujets IA (graphe, NLP, image, etc) et au développement des briques techniques transverses (« services ») dans la « plateforme data » .Ce poste sera centré sur les projets de Recherche et Développement (R&D) qui ont pour objectif de pour identifier les gènes clés d'une maladie, optimiser le design d'une molécule, repérer les biomarqueurs de résistance ou de réponse à un médicament à partir de données variées telles que les données textuelles, les images médicales et les données génomiques.Pour déployer ces solutions, nous développons des algorithmes de machine learning et deep learning autour des technologies de graphe sur des réseaux de gènes, de protéines et de médicaments pour mieux comprendre les relations complexes entre ces éléments et les maladies associées ; des modèles de NLP (Natural Language Processing) pour extraire des informations à partir de textes biomédicaux, tels que les publications scientifiques et les rapports cliniques; de l'analyse d'image médicales comme le IRM, les biopsies, entre autres.Le poste est basé à notre siège à Suresnes et des déplacements au centre de Recherche et Développement à Saclay sont à prévoir.Vos missions :vous êtes impliqué(e) dans l'engagement de l'équipe au quotidien et faites tout pour l'aider pour délivrer des fonctionnalités en continuevous travaillez en étroite relation avec les autres membres de la feature team pour aider à la création des algorithmes nécessaires pour les cas d'usages développés pour les équipes métiervous échangerez de manière continue avec les métiers car nous pensons que la proximité avec le métier est la clef pour toucher le bon besoin businessvous mettez en place les nouveaux flux d'entrée et de sortie au sein de la plateforme data, et irez jusqu'au modeling et à l'activation de la donnéevous assurez le delivery, et êtes constamment en veille sur les nouvelles technos.Votre formation :De formation supérieure en école d'ingénieur/université niveau Bac+5 (PhD est un plus), vous possédez au minimum 6 ans d'expérience professionnelle en tant que Data Scientist.Vos compétences :TECHNIQUES

vous maitrisez le développement en Python, et SQL ainsi que les méthodes et librairies de machine learning

vous avez la capacité à lire et comprendre des articles scientifiques sur le machine learning et de les appliquer aux données biologiques

vous avez des excellentes compétences en communication et en collaboration pour participer à la validation des résultats des modèles et des analyses avec l'équipe R&D

vous pensez que le notebook Jupyter n'est pas une fin en soi et la scalabilité de votre algorithme est un prérequis pour son activation,

vous avez la capacité à maintenir la chaîne Big Data, de la récupération de la donnée jusqu'à son exploitation finale, dans une approche CI/CD, avec des technos tel que docker,

vous avez une connaissance des données biologiques (génomique, imagerie médicale, données moléculaires) avec une expérience solide dans le domaine biomédical ou pharma,

vous avez une connaissance de l'environnement Google Cloud Platform et la suite Vertex AI ou d'un autre framework MLOps

une première expérience de leadership technique est un plus

Anglais professionnel nécessaire.PERSONNELLES

vous avez l'esprit d'équipe et êtes impliqué(e) dans votre travail au quotidien,
vous êtes curieux (se), rigoureux (se), structuré(e),
vous avez hâte de proposer des améliorations, les partager et les prioriser avec vos collègues,
vous participez à des évènements de l'univers Big Data (meetups, conférence, etc.).

Quel que soit votre domaine d'expertise, votre travail au sein du Groupe Servier contribue à faire avancer le progrès thérapeutique au bénéfice des patients. Vous ferez partie d'équipes reconnues pour leur excellence scientifique et développerez votre plein potentiel dans un environnement professionnel qui vous encourage à vous développer. Des parcours d'intégration sur mesure, des opportunités de mobilité, des formations de qualité, un management responsable, un esprit d'équipe... Tout cela et plus encore dans un lieu de travail axé sur votre bien-être.Chez Servier, nous sommes engagés dans le progrès thérapeutique au service des besoins des patients. Nous mettons la diversité de nos collaborateurs comme une source de richesse pour l'accomplissement de cette vocation.

Servier

Postuler