Ingénieur en traitement automatique de la langue - CDD 18 mois - Paris-Saclay F/H

Commissariat à l'Énergie Atomique

  • Saclay, Essonne Paris
  • CDD
  • Temps-plein
  • Il y a 1 mois
Entité de rattachement Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
  • La conscience des responsabilités
  • La coopération
  • La curiosité
Référence 2024-31427Description de la DirectionLa direction de la recherche technologique du CEA (DRT), dispose d'un portefeuille de technologies dans les domaines de l'information et de la communication, de l'énergie et de la santé. Interface entre la recherche et l'industrie nous avons pour mission la maturation et le transfert technologique, en allant de la preuve de concept théorique jusqu'au démonstrateur industriel, pour en faire bénéficier l'industrie.Le CEA List, Laboratoire de recherche spécialisé dans les systèmes numériques intelligents est situé au cœur du pôle scientifique et technologique de Paris-Saclay.Description de l'unitéAu sein du CEA List, vous serez intégré au Service d'Intelligence Artificielle pour le Langage et la Vision (SIALV) et collaborerez avec des chercheurs spécialisé sur (i) la compression de réseaux de neurones (ii) la vision par ordinateur frugale à partir de nuages de points 3D (iii) les modèles génératifs visuels.
Vous travaillerez dans un projet en collaboration avec un autre laboratoire du CEA List, le Laboratoire Intelligence Artificielle Embarquée (LIAE), qui a pour mission le développement de solutions innovantes pour l'IA embarquée et est le principal contributeur de la plateforme logicielle open source de conception, d'optimisation et d'intégration de réseaux de neurones pour l'embarqué, N2D2 (https://github.com/CEA-LIST/N2D2). Cette plateforme a pour vocation d'être la plateforme européenne de référence pour l'IA embarquée, avec le soutien d'un large consortium d'industriels et de fournisseurs de composants.Description du posteDomaineMathématiques, information scientifique, logicielContratCDDIntitulé de l'offreIngénieur en traitement automatique de la langue - CDD 18 mois - Paris-Saclay F/HStatut du posteCadreDurée du contrat (en mois)18Description de l'offre« Rejoignez le CEA pour donner du sens à votre activité, mener et soutenir des projets de R&D nationaux et internationaux, cultiver et faire vivre votre esprit de curiosité. »EN SYNTHESE, QU'EST-CE QUE NOUS VOUS PROPOSONS ?Dans le cadre du développement de ses activités pour l'amélioration du traitement des données en particulier sur des aspects de confiance et de frugalité, le laboratoire recherche un ingénieur pour développer et intégrer des briques technologiques dans le domaine du traitement automatique des langues. Les tâches visées par ces technologies concernent l'extraction d'informations.Ce poste de cadre en CDD de 18 mois est basé sur le site Nano-Innov de Paris-Saclay, Essonne (91).Il s'agit d'un poste à pourvoir dès que possible.POURQUOI NOUS REJOINDRE ?Vous intégrez une équipe dynamique, au cœur de l'écosystème IA en France, qui a noué des liens privilégiés avec les principaux acteurs industriels et académiques du domaine.Le laboratoire développe des algorithmes robustes pour l'extraction, l'analyse et le l'interprétation de grands volumes de données multimédia (texte/image).Nos technologies ont contribué à l'émergence de nouvelles activités économiques par la création de startups.Le laboratoire participe à de nombreux projets collaboratifs (ANR, Horizon Europe, Pôle de Compétitivité) avec des partenaires académiques, PMEs ou grands industrielsQU'ATTENDONS-NOUS DE VOUS ?Dans l'objectif de mettre en place ces outils d'analyse de textes pour la détection d'évènements d'intérêt à partir des informations disponibles sur le Web et les réseaux sociaux, votre mission consistera plus particulièrement à :
  • prendre en main et améliorer les outils existants d'analyse de textes développés au sein du laboratoire
  • intégrer et/ou développer de nouveaux outils de reconnaissance d'entités nommées et détection d'évènements, selon la nature des informations à associer aux données (qui dépendra des taxonomies et terminologies fournies par les partenaires)
  • favoriser les approches multilingues ou indépendantes de la langue dans les outils développés afin de pouvoir traiter des contenus textuels multilingues
  • assurer l'intégration de ces briques technologiques au sein des plateformes logicielles des partenaires
  • réaliser le packaging, définir avec les autres partenaires les environnements, assurer les tests techniques et la compatibilité entre les packages ;
  • rédiger, contrôler et mettre à jour les documents nécessaires à la mise en exploitation
  • améliorer le fonctionnement et la qualité des briques développées en interaction avec les utilisateurs/partenaires
  • assurer la liaison avec les autres partenaires et prendre en charge le support technique
  • effectuer de la veille technologique et scientifique
L'application de ce travail pourra se faire dans le cadre d'un domaine spécifique à un projet, mais les approches mises en œuvre devront être suffisamment génériques pour s'appliquer sur n'importe quel domaine.Profil du candidatCOMPÉTENCES REQUISES :Niveau Bac+5 ou Doctorat avec des connaissances en machine learning, deep learning et traitement automatique des langues.Compétences techniques :Le candidat sera amené à travailler sur tous les aspects du développement de la solution: conception, programmation, packaging et déploiement.Dans ce contexte, une familiarité avec Linux et l'outil Docker est un avantage.Par ailleurs, le langage de programmation principal sera Python.
  • Langages de programmation : Python, JavaScript, HTML/CSS, C++;
  • Librairies et frameworks : scikit-learn, Pytorch, optuna, spaCy, FastAPI;
  • DevOps : docker, docker-compose, slurm, git
Compétences savoir-être :
  • Autonomie tout en appréciant le travail en équipe ;
  • Adaptabilité et capacité de renouvellement et d'enrichissement des compétences de manière continue, étant donné la rapidité d'évolution des développements en IA;
  • Capacités d'expression, orale et écrite, en français et anglais
VOUS AVEZ ENCORE UN DOUTE ?Les à-côtés de votre mission principale peuvent nous intéresser :
  • Un écosystème de recherche à la pointe, unique en son genre et dédié à des thématiques à fort enjeu sociétal, qui donne du sens à votre mission
  • Des formations pour renforcer vos compétences, en acquérir de nouvelles et booster votre mission
  • Un équilibre vie privée / vie professionnelle reconnu par nos collaborateurs
  • La possibilité de télétravailler pour équilibrer les temps de transport et contribuer à votre qualité de vie
  • Un CE riche en avantages et en activités sociales, culturelles et sportives
  • Un lieu de travail au cœur d'un plateau dynamique, entouré d'écoles et d'entreprises de la tech
Cela vous tente ? Postulez, ce poste est fait pour vous !Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes en situation de handicap, cet emploi est ouvert à toutes et à tous#CEA-List #NumericalSimulation #AILocalisation du posteSiteSaclayLocalisation du posteFrance, Ile-de-France, Essonne (91)VillePalaiseauCritères candidatLangues
  • Français (Courant)
  • Anglais (Courant)
Formation recommandéeIngénieur ou Master système embarqué, informatiqueDemandeurDisponibilité du poste01/07/2024

Commissariat à l'Énergie Atomique