
STAGE] Data Scientist H/F
- Palaiseau, Essonne
- Stage
- Temps-plein
- Faire partie des entreprises ayant obtenu la certification Great Place to Work.
- 33% de notre chiffre d'affaires issu de missions contribuant à réduire l'impact environnemental de nos clients (GreenTrust).
- La réduction de 15% de notre empreinte carbone.
- En mode projet, vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement. Vous contribuerez au développement des 4 axes principaux du groupe :
- Inspection 4.0 : développements d'algorithmes de computer vision et NLP en soutien aux experts métiers sur le terrain
- Assistants SOCOTEC : développement d'agents personnalisés pour les services du groupe (RAG, text-to-SQL, …)
- IA+X pour des nouveaux services : développement de technique d'hybridation entre physique et IA (jumeau numérique, PINN)
- Extraction d'information à partir de documents et de plans
- Vous choisirez un sujet de R&D pour vous confronter à l'état de l'art du domaine avec des possibilités de publication scientifique. Les sujets sont présentés et détaillés ci-après:
- Agent de génération de rapport avec canevas intégré dans une plateforme LLM
- Agent de Knowledge Management (AXONE IA, RESOTECH IA) employés des techniques de RAG avancés
- Smart speech-to-text : transcription et extraction intelligente d'informations avec des LLMs
Vous aurez la possibilité d'interagir à l'international (US, UK, ITA, ESP, NL) et des opportunités de mobilité internationale sont possibles.Vous ferez preuve d'autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de son code. L'offre peut déboucher sur un CDI à la fin du stage.Qualifications
- Master en Data Science / Machine Learning ou Ingénieur Généraliste avec appétence en data
- Bonnes connaissances en statistiques (modélisation, analyse factorielle …)
- Maîtrise du langage Python et des bases de données relationnelles (SQL)
- Utilisation des outils collaboratifs de développement (GIT, GITLAB, NoteBooks Jupyter, etc …)
- Aisance avérée avec les algorithmes de machine learning et de deep learning (un minimum de connaissances théoriques est requis) et maîtrise d'au moins une bibliothèque spécialisée (TensorFlow, Keras, PyTorch …)
- Connaissance sur les larges language models (LLM)
- Connaissance AWS appréciée (Lambda, Timescale, S3)
- Gout affirmé pour les technologies innovantes
- Esprit d'équipe
- Anglais courant et technique
Vous prendrez part à des projets captivants et de grande envergure où vous aurez un vrai
rôle à jouer !Vous vous engagez sur la charte des valeurs qui font le socle de la société :
- Cohésion & Dynamisme
- Performance & Qualité
- Innovation & Excellence Technique