Compétences indispensables :
Maîtrise des fondamentaux du Machine Learning : compréhension des concepts clés, des algorithmes et
des méthodes d'évaluation
o Excellente maîtrise de Python
o Maîtrise des principales bibliothèques d’IA et de data science (PyTorch, TensorFlow, Scikit-learn)
o Maîtrise des tâches de pré-traitement des données textuelles (parsing, expressions régulières,
enrichissement (POS Tagging, dependency parsing), normalisation via lemmatisation ou stemming,
correction orthographique)
o Bonne compréhension des architectures de réseaux de neurones (notamment les RNN, LSTM, GRU), de
transformer et du fonctionnement des LLM
o Solide expérience dans la conception et l’implémentation de systèmes d’IA générative avancés basés sur
des LLM
o Maîtrise des architectures RAG et de leurs principaux composants (techniques de chunking,
embeddings, indexation vectorielle, retrieval, reranking)
o Maîtrise du prompt engineering avancé
o Maîtrise des techniques et métriques d’évaluation NLP et LLM et des systèmes RAG
o Maîtrise de l’analyse de factualité, robustesse et hallucinations des modèles
o Maîtrise du déploiement de modèles IA dans des environnements cloud
o Capacité à accompagner techniquement des datascientists
o Capacité à restituer et communiquer efficacement les résultats des travaux menés en datascience et IA
o Capacité à travailler en équipe
o Gitlab : Connaissances de versionning et de partage de code (add, commit, push, pull, …)
Compétences nécessaires :
Maîtrise des services AWS utilisés pour les projets IA Générative (SageMaker, Bedrock, OpenSearch,
S3)
o Maîtrise de frameworks dédiés aux applications LLM (LangChain, LlamaIndex)
o Expérience dans la conception de workflows LLM complexes (agents, orchestration de chaînes de
prompts, tool use / function calling)
o Maîtrise des techniques de fine-tuning de modèles (PEFT, LoRA, QLoRA)
o Réalisation de projets dans l’environnement Dataïku
o Gestion de la donnée dans un contexte réglementaire RGPD/AI Act
o MLOps : expérience avec des outils et des pratiques pour automatiser le cycle de vie du ML, y compris
l'intégration continue, le déploiement continu et la surveillance des modèles
o Appétence à l’innovation et à la veille technologique : capacité à rester à jour avec les dernières
avancées en IA
o Proactivité et dynamisme
o Aisance et rigueur rédactionnelle
Réinventer l’avenir : l’innovation humaine au cœur de la technologie 🚀 Quelques chiffres clés 30+ clients accompagnés 25+ experts data & IA 2.6 M€ de chiffre d’affaires 2 centres d’expertise 100+ formations par an 15% du CA investi en R&D 🧠 Notre mission Placer l’humain au cœur de la donnée pour créer des solutions intelligentes, responsables et à impact, en alliant expertise technologique, innovation et agilité. 🧩 Nos domaines d'expertise Stratégie data & gouvernance Transformation & qualité de la donnée Ingénierie Big Data Science des données & IA DevOps & automatisation Formation & acculturation data 💡 Nos services Diagnostic de maturité Roadmap IA & data IA générative & éthique Automatisation intelligente Analyse prédictive Data visualisation & UX Gouvernance & qualité des données Architecture cloud & CI/CD 👥 Notre équipe 25+ experts data 10+ spécialistes en stratégie data 5 PhD R&D 5 formateurs certifiés 🧬 Notre méthodologie Customer-centric : solutions co-construites avec nos clients Approche Agile & itérative Expertise sur toute la chaîne de valeur data Autonomisation des équipes métiers 🔁 Cycle de vie de la donnée Collecte multi-source Qualité & préparation Visualisation & dataviz Analyse prédictive & IA Déploiement automatisé (CI/CD) 🎓 Craftmandata Académie Formations inter/intra-entreprise Distanciel ou présentiel Modules sur l’IA, Cloud, DataViz... Formation de "champions métiers" 🧪 Craftmandata Lab – L’innovation concrète 15% du CA dédié à la R&D Projets internes : IA de qualité de données Détection de fraude Classification automatique NLP sur verbatims clients Suivi de la mixité & égalité Calcul de bilan carbone numérique 🛠 Notre écosystème technologique Cloud & microservices Big Data & NoSQL Machine Learning & Deep Learning VueJS, Redis, API, ELT/ETL Outils low/no-code Datalake, Data Catalog, DataViz 🌍 Nos clients & secteurs Banque | Assurance | Industrie | Énergie | Retail | Télécom | Transport