
Data Scientist NLP / GenAI senior DeepSearch
- Paris
- 65 000 €/an
- Contrat
- Temps-plein
- Développer des algorithmes de NLP et GenAI afin d'améliorer les modèles de restitutions de connaissances récoltées sur le web
- Explorer et créer des supports d'information permettant de transmettre la connaissance à l'utilisateur en tenant compte de sa charge cognitive (Visual Language Model, Text to Speech, graphes de connaissances…)
- Garantir la traçabilité et la fiabilité des résultats (IA explicable) en reliant les synthèses à leurs sources originales
- Concevoir des solutions d'IA performantes, scalables et souveraines (LLM open-source, solutions on-premise…)
- Réaliser une veille et mener des expérimentations pour évaluer de nouvelles approches ou de nouveaux modèles (LLMs, RAG, vector databases…)
- Travailler en binôme avec un post-doctorant, participer à la structuration de l'équipe et à la montée en compétences des autres membres de l'équipe sur les sujets d'IA générative et NLP.
- Expertise en IA générative : maitrise des LLMs open-source (Llama, Mistral, Falcon…), architectures RAG, prompt engineering, frameworks d'inférence, bases de données vectorielles et techniques de grounding de modèles
- Maitrise des techniques de NLP fondamentales (reconnaissance d'entités nommées, classification de texte, topic modeling, résumé automatique de texte) et des bibliothèques associées (Hugging Face Transformers, SpaCy, NLTK)
- Maitrise de Python, des bibliothèques d'analyse de données (Pandas, NumPy) et des frameworks de Machine Learning / Deep Learning (PyTorch et/ou TensorFlow)
- Compétences solides en développement logiciel appliquées à des projets d'IA (Python, Git, tests..)
- Une expérience en optimisation de modèles IA pour la performance et la scalabilité, avec une sensibilité aux enjeux de souveraineté numérique est un plus
- Des connaissances en Docker et CI/CD sont un plus
- Curiosité technique, rigueur scientifique et autonomie
- Capacité à documenter et à rendre compte de votre travail
- Orientation résultats
- Appétence pour le partage de connaissances, le travail en équipe et le mentoring
- Date de décollage : dès que possible
- Base de lancement : Paris 9ème - 2 jours de télétravail par semaine
- Combustible : à partir de 65 k€ brut annuel, selon profil et expérience
- Poste en CDI
- Processus de recrutement : 1 entretien avec un.e recruteur.se Science me Up + 1 entretien avec le CTO et le CEO + 1 test technique + 1 entretien final pour débriefer du test