Description du poste
Votre rôle :
En tant que Data Ingénieur orienté IA, vous serez un acteur clé de la mise en place des fondations techniques, des pipelines de données et de modèles, et de la préparation à l'industrialisation des expérimentations IA/Data menées par la Fabrique.
Pour y parvenir, voici les missions qui vous seront confiées :
- Ingénierie des données & préparation IA
- Concevoir et automatiser des pipelines d'ingestion, transformation et feature engineering (API, fichiers, BDD, non structurées).
- Garantir qualité, fraîcheur, traçabilité et versioning des datasets d'entraînement/validation.
- Mettre à disposition des environnements d'expérimentation et des jeux de données prêts à l'emploi.
- Intégration IA & MLOps
- Co-industrialiser avec les DS : entraînement, déploiement, CI/CD, monitoring des modèles.
- Exposer des API / microservices d'accès aux données et modèles (conteneurisation, orchestrateurs).
- Implémenter des workflows IA générative / RAG (bases vectorielles, données internes), avec optimisation perf/coûts.
- Innovation & expérimentation
- Contribuer aux POC/POV/MVP et préparer leur passage en production.
- Évaluer/prototyper de nouvelles technos Data/IA (vector DB, orchestrateurs ML, frameworks open-source) et partager les retours de tests.
- Assurer une veille structurée sur outils et architectures émergentes.
- Collaboration transverse & gouvernance
- Travailler au sein de squads multi-compétences avec Data Scientists, Tech Leads, Architectes, Métiers et autres pôles de la Fabrique.
- Documenter architectures, flux et jeux de données pour faciliter réutilisation et pérennisation.
- Contribuer à l'industrialisation des solutions validées avec les équipes DSI.
De formation bac+4/5 (école d'ingénieur ou master) avec une spécialisation en informatique, data engineering, IA ou systèmes distribués, vous justifiez d'une expérience de 4 à 6 ans en ingénierie des données, idéalement dans un contexte mêlant data et intelligence artificielle.
Une expérience en projets d'expérimentation, POC, MVP ou RAG/IA générative est fortement appréciée.
Compétences
- Langages & développement
- Python (indispensable), SQL, Scala/Java.
- Traitement & orchestration des données
- ETL/ELT, batch & streaming.
- Airflow/Prefect, dbt pour la transformation.
- Spark/Kafka pour le calcul distribué et l'ingestion temps réel.
- Stockage & gestion des données
- Data Lake / Data Warehouse.
- Formats & tables : Parquet, Delta Lake.
- Catalog/métadonnées pour le lignage et la découverte.
- Cloud & plateforme
- Azure / AWS / GCP (services data & IA managés).
- MLOps & intégration IA
- MLflow (expérimentation, modèles), CI/CD, monitoring des modèles.
- Docker / Kubernetes (packaging, déploiement).
- IA générative / RAG : bases vectorielles (FAISS, Milvus, Pinecone), frameworks (LangChain, Hugging Face, Transformers).
- Data Visualization
- Outils/bibliothèques de visualisation et storytelling orienté décision.
- Bonnes pratiques & gouvernance
- Git (versioning), documentation, sécurité, gouvernance des données.
- Compétences comportementales
- Esprit analytique et rigoureux, orienté qualité des données.
- Curiosité et appétence forte pour l'intelligence artificielle et ses applications.
- Capacité à travailler en équipe et à collaborer avec des profils variés.
- Autonomie, adaptabilité et proactivité.
- Goût pour l'expérimentation, l'innovation et la recherche de solutions pragmatiques.