
Stage - Data Scientist spécialisé en apprentissage par renforcement (RL) - F/H/N
- Paris
- Stage
- Temps-plein
- Recherche et approfondissement de la littérature.
- Développer et valider expérimentalement de nouveaux algorithmes d'optimisation pour agents LLMs.
- Entrainer des modèles pour des métiers spécialisés.
- Écriture d’un article sur la méthodologie développée durant le stage.
- Faire de la veille bibliographique.
- Choisir les algorithmes à explorer.
- Définir la roadmap avec les objectifs à réaliser.
- Exploration des possibilités existantes de package proposant d'implémenter ce genre de solution.
- Contribution à l’outil OpenSource répondant aux besoins.
- Partage aux autres Octos pendant et à la fin du stage, rédaction d’un article.
- Vous préparez un BAC+5 et vous êtes à la recherche d'un stage de fin d'études.
- Vous avez une appétence pour les sujets de Data Science et pour l’exploration de l’état de l’art.
- Vous savez expliquer comme marche un modèle complexe et êtes intéressé par le Reinforcement Learning.
- Vous souhaitez approfondir vos compétences en participant à des sujets open-source.
- Vous êtes curieux, ambitieux et autonome.