
DOCTORANT-E : INDEXATION ET RECHERCHE DE CONTENUS VISUELS DANS LES NUAGES DE POINTS À LARGE ÉCHELLE
- Champs-sur-Marne, Seine-et-Marne
- CDI
- Temps-plein
- Indexation inter-domaines : cela nécessite de trouver des représentations permettant d’établir des liens entre les contenus 2D(+t) et 3D. La littérature est riche en ce qui concerne l’indexation et la recherche d’informations dans un seul domaine, que ce soit pour les images [Pion et al., 2020 ; Blettery et al., 2023] ou pour les nuages de points 3D [Uy et al., 2018 ; Komorowski, 2021 ; Hui et al., 2022 ; Vidanapathirana et al., 2022 ; Zhang et al., 2024]. Plusieurs solutions existent également pour la mise en correspondance 2D–3D [Li et al., 2021 ; Qin et al., 2022], dans le cadre du recalage, mais elles ne sont pas applicables à la recherche à grande échelle, car elles supposent connue la géolocalisation du contenu 2D pour effectuer son alignement avec la 3D. À l’instar des Vision Language Models qui alignent images et textes, nous privilégierons des méthodes fournissant un espace d'encodage commun entre 2D et 3D [Xie et al., 2023 ; Xue et al., 2023 ; Sohail et al., 2025], exploitable comme index pour la recherche. Nous concentrerons cependant notre attention sur la difficulté d’aligner ces contenus dans un contexte multi-date, où la scène a évolué au fil du temps.
- Recherche à grande échelle (au moins à l’échelle d’une ville) : notre travail s’appuiera sur les travaux déjà menés au LASTIG concernant la recherche dans les nuages de points 3D [Zede et al., 2025], inspirés du Differentiable Search Index [Zhuang et al., 2022], des GD-MAE Sparse Pyramid Transformers [Yang et al., 2023] et de la recherche par faisceau (Beam Search), qui permettent d’accélérer considérablement la recherche dans des bases de données volumineuses. Afin d’améliorer le passage à l’échelle de ces approches, l’utilisation de l’architecture Mamba [Gu et al., 2024] pourra être explorée, à la fois pour l’encodage des nuages de points via MambaPoint [Cheng et al., 2024] et pour la recherche par Differentiable Search Index. On pourra également s’intéresser aux architectures à mélange d’experts (Mixture of Experts), qui ouvrent des perspectives prometteuses, plus faciles à entraîner et à mettre à jour [Cai et al., 2025].
Grâce au consortium AGAPE, à la participation de l’IGN et aux données ouvertes disponibles dans le domaine du patrimoine culturel, le doctorant bénéficiera de jeux de données variés et de grande ampleur : des collections anciennes d’images et de vidéos représentant le territoire français, aussi bien à l’échelle aérienne que terrestre (plus de 70 000 images) ; des nuages de points 3D LiDAR de l’IGN à grande échelle, couvrant l’ensemble de Paris via une cartographie mobile terrestre, ainsi que les données issues de la campagne nationale de LiDAR HD aérien en cours d’acquisition.Organisation
- Date de démarrage : flexible, idéalement au dernier trimestre 2025.
- Financement : contrat doctoral de 3 ans, incluant les missions en France et à l’étranger.
- Lieu : La thèse sera réalisée en région parisienne, au sein du laboratoire LASTIG, situé sur le campus de l’Université Gustave Eiffel à Champs-sur-Marne.
- Le doctorant sera rattaché à l’École Doctorale MSTIC (ED 532).
- Cadre académique de la recherche au sein du laboratoire LASTIG et de l'université Gustave Eiffel
- Liens avec les services d'innovation et de production de l'IGN pour l'identification de verrous scientifiques à fort impact sociétal
- Pratique possible du télétravail après une période de prise de poste
- Équipements sportifs disponibles sur site
- Restauration d’entreprise
- Remboursement transport 75% et indemnités kilométriques vélo
- Laurent Caraffa –
, Directrice de recherche au LASTIG (directrice de la thèse), IGN, Univ. Gustave Eiffel