Notre client recherche un Lead Data Scientist pour accompagner un programme stratégique autour de l'implémentation et de l'industrialisation de cas d'usage Data Science appliqués à la gestion et à l'optimisation d'actifs énergétiques renouvelables (photovoltaïque, stockage batterie, éolien).
Dans ce contexte, les modèles de Data Science sont considérés comme des leviers opérationnels et financiers au service des équipes métiers. Le Lead Data Scientist interviendra avec une forte dimension stratégique et technique afin de structurer les use cases, développer des briques algorithmiques robustes et piloter leur industrialisation au sein d'une plateforme Data moderne.
Il/elle jouera également un rôle central dans la mise en place des bonnes pratiques MLOps, la gouvernance des modèles et l'alignement entre enjeux métiers et solutions data.
Périmètre de mission
Structuration des Use Cases : • Formalisation des cas d'usage Data Science à partir des besoins métiers (performance des actifs, opérations \& maintenance, pilotage financier)
• Définition des KPIs et indicateurs de succès
• Priorisation des use cases selon leur impact métier et leur faisabilité technique
• Définition de l'architecture cible pour leur intégration dans la plateforme
Implémentation algorithmique : • Conception et développement de briques algorithmiques robustes et industrialisables
• Développement de modèles de prévision (séries temporelles, machine learning, approches hybrides)
• Mise en place de modèles de segmentation et clustering d'actifs
• Détection d'anomalies et identification précoce de dérives opérationnelles
• Modélisation de l'impact financier des écarts de production
• Benchmark et optimisation de la performance des actifs
Industrialisation \& MLOps : • Déploiement des pipelines Data Science sur Databricks
• Orchestration des workflows via Apache Airflow
• Mise en place de pipelines batch et near real-time
• Définition et mise en œuvre d'un framework MLOps
• Gestion du cycle de vie des modèles (versioning, monitoring, reproductibilité)
Livrables attendus
• Formalisation technique des use cases priorisés
• Briques algorithmiques développées, testées et validées
• Pipelines Data \& ML industrialisés
• Documentation technique complète
• Framework MLOps structuré et opérationnel
Expertise souhaitée
Environnement technique : • Databricks (data platform \& compute)
• Apache Airflow (orchestration)
• Python (expert)
• SQL
• MLflow ou équivalent
• Expérience sur des données industrielles volumineuses (séries temporelles)
Profil : • Senior avec forte expérience en Data Science appliquée
• Capacité à interagir avec des interlocuteurs métiers et à traduire les besoins business
• Expérience en gouvernance des modèles et structuration d'environnements Data
• Orientation résultats et impact métier