Qui sommes-nous ? MP DATA est une entreprise spécialisée dans l'acquisition, le traitement et la valorisation des données. Depuis 2015, elle accompagne principalement des industriels dans l'optimisation de leur performance et l'exploitation de leurs données. Ses collaborateurs, issus de grandes écoles, incarnent les valeurs d'Excellence, de Partage et d'Engagement. Leur expertise technique et méthodologique leur permet d'intervenir sur des projets d'envergure. MP DATA structure son offre autour de trois pôles : Conseil et Stratégie Infrastructure & CloudOPS Data Science Ici, les missions s'adaptent aux aspirations des collaborateurs. Mobilité, changement de secteur ou acquisition de nouvelles compétences : chacun est accompagné dans son évolution. Rejoindre MP DATA, c'est s'engager sur des projets passionnants dans un cadre technique exigeant. Votre mission : L'IA générative, les LLM et les approches comme le Retrieval-Augmented Generation (RAG) vous passionnent ? Vous souhaitez les appliquer à des problématiques métier concrètes chez des clients industriels ? C'est exactement ce que nous proposons. Nous recherchons un(e) Data Scientist expérimenté(e) pour intervenir, dans le cadre d'une mission longue, chez l'un de nos clients grands comptes, sur un projet structurant autour de l'IA générative :
- Adapter des modèles de langage à des besoins spécifiques (fine-tuning, prompt engineering, distillation).
- Concevoir et expérimenter des systèmes RAG intégrant des bases de connaissances métiers.
- Optimiser les performances des modèles de génération et de recommandation dans un environnement réel.
- Collaborer avec les Data Engineers pour assurer l'industrialisation des solutions.
- Interagir avec les équipes métier pour garantir un impact opérationnel concret.
- Mener une veille active sur les évolutions des transformers, diffusion models et approches hybrides. ️ Profil recherché :
- Diplômé(e) d'une grande école d'ingénieur (2ans), avec une solide expérience en IA générative et Machine Learning.
- Maîtrise de Python, TensorFlow, PyTorch, Hugging Face Transformers, LangChain, LlamaIndex.
- Bonne connaissance des architectures RAG, fine-tuning de modèles de langage et bases de données vectorielles (FAISS, Pinecone.).
- Une expérience sur le déploiement de modèles en production et l'environnement Cloud (AWS, GCP ou Azure) serait un plus.
- Une expérience avec GCP serait également un atout.
- Esprit critique, curiosité et goût pour le travail en équipe interdisciplinaire.