About Partnerships Blog TRY FOR FREE

About Partnerships Blog

-10% off the annual subscription by signing up for the newsletter.

Receive a free market study by email, every week.

FreeMatch est un tableau de bord destiné aux professionnels du secteur technologique français, offrant un accès à diverses données sur l'état du marché.

Navigation

Jobs À propos Blog Se Connecter

Liens utiles

Accueil Partenariats Feedback Mentions légales CGV

Nous suivre

Nous sommes là pour vous aider !

Liens internes

Trouvez votre prochain emploi tech Missions full stack premium Les meilleures opportunités web Missions freelance premium Travaillez d'où vous voulez Opportunités senior qualifiées Lancez votre carrière Backend & architecture Frontend & UI/UX Développement mobile natif et hybride Applications iOS natives Applications Android natives React & Next.js Applications Angular entreprise Applications Vue.js modernes Full Stack JavaScript Applications TypeScript Infrastructure as Code Expert Google Cloud Applications React Native Missions Full Stack à Paris Missions React à Paris Opportunités Full Stack à Lyon Missions Backend à Lyon Emplois Full Stack à Toulouse Missions DevOps à Toulouse Offres Full Stack à Nantes Missions Frontend à Nantes Emplois Full Stack à Bordeaux Missions Mobile à Bordeaux

2025 FreeMatch. Tous droits réservés.

Stagiaire Assistant IA / DATA - RAG hiérarchique H/F - undefined | FreeMatch

Stagiaire Assistant IA / DATA - RAG hiérarchique H/F

Intelligence artificielle

Python

Pytorch

Brest, Bretagne

Télétravail : none

internship

Publié il y a 2 mois

Description du poste

Stage de 6 mois à pourvoir sur Brest à partir du 02/03/2026

État de l'art : Étudier les méthodes de retrieval denses (bi-encodeurs) et les techniques d'encodage de documents structurés (ex: modèles de layout-aware).

Modélisation & Implémentation :
- Conserver la représentation latente (embedding) de chaque "chunk" (élément fin).
- Entraîner un modèle d'agrégation au niveau de la Page, qui produit un unique vecteur sémantique encapsulant tous les éléments qu'elle contient.
- Entraîner un modèle d'agrégation au niveau du Document, qui produit un vecteur global encapsulant l'ensemble de ses pages.

Expérimentation :
- Mettre en œuvre le pipeline de recherche hiérarchique.
- Évaluer rigoureusement la performance du retriever en utilisant notre benchmark interne déjà établi, basé sur une évaluation au niveau de la page.
- Analyse & Synthèse : Comparer l'approche hiérarchique aux méthodes de RAG "plates" (flat RAG) et rédiger un rapport technique.

Étudiant(e) en Master 2 ou dernière année d'École d'Ingénieur (Informatique, IA, Data Science, NLP).
Compétences solides en Python et dans un framework de Deep Learning majeur (PyTorch).
Un premier contact avec les systèmes RAG (ex: LangChain, LlamaIndex) ou les bases de données vectorielles est un plus très apprécié.
Qualités : Rigueur scientifique, curiosité, autonomie et goût pour la R&D fondamentale.

A propos de l'entreprise

---, ()

Postuler maintenant