Contexte
OnSpark est un cabinet spécialisé dans la GMAO/EAM et l'intégration SI, en forte croissance (40 collaborateurs, CA 3,3 M€). Dans le cadre de la diversification de son offre vers la Data et l'Intelligence Artificielle, nous recherchons un Data Engineer / Data Scientist pour accompagner nos clients grands comptes. Vous interviendrez au sein d'un Pôle Data mature, exploitant une plateforme Big Data on-premise (Cloudera Data Platform Private Cloud) et un environnement de Data Science (Cloudera Machine Learning). Vos missions s'articulent autour de l'ingestion de données massives issues de multiples partenaires institutionnels, de l'accompagnement des équipes métier et de la mise en œuvre de cas d'usage data avancés (data science, IA, machine learning, NLP, dataviz).
ResponsabilitésCollecte des données
Développer, industrialiser et maintenir des pipelines d'ingestion de sources de données internes et externes
Participer à la préparation et au suivi de la qualité des données
Identifier des opportunités d'utilisation de nouvelles données
Expertise & accompagnement métier
Accompagner les chargés d'études dans leur utilisation de la plateforme de données (POC/POV, support, expertise, formation)
Contribuer et maintenir en condition opérationnelle les cas d'usage sur la plateforme (simulateurs, prévisions, indicateurs, data science, IA)
Valoriser et exposer les résultats via des outils de visualisation ou de micro-services
Sécuriser & MCO
Comprendre les contraintes des équipes supports (sécurité, infrastructure, RGPD)
Contribuer aux bonnes pratiques de développement, standardisation des livrables, amélioration continue
Formation Bac+5 (École d'ingénieur ou Master Big Data / Data Science)
Minimum 5 ans d'expérience dans les activités d'ingénierie data
Maîtrise de l'écosystème Hadoop : HDFS, Yarn, Oozie, Airflow, Spark, Hive, Impala
Distribution Cloudera CDP on-premise
Maîtrise du calcul distribué Spark on Yarn
Langages : Python (Pandas, Plotly), PySpark, R, SQL/HQL
Compétences en Machine Learning & Deep Learning
Connaissance d'au moins un outil de datavisualisation (QlikSense, Tableau, Power BI…)
Connaissance des principes de gouvernance de la donnée (dictionnaire, qualité, RGPD)
Connaissance des principes Agile / Cycle V
Bonnes pratiques CI/CD et versionning
La connaissance du secteur public et de la protection sociale est un plus
Excellentes qualités relationnelles, communicationnelles et rédactionnelles
Présence physique requise à Paris 12ème (télétravail possible jusqu'à 2 jours/semaine)
Mission longue durée avec possibilité d'intégration en CDI
Collaboration avec les équipes internes et autres prestataires
Onspark est une entreprise innovante qui accompagne les organisations dans leurs projets de transformation digitale en intégrant des solutions technologiques robustes et évolutives. Nous intervenons sur des environnements complexes, en combinant expertise métier et savoir-faire IT. Ce que nous faisons : Intégration & Développement : mise en place de solutions logicielles performantes, interopérables et sécurisées. Cloud & Infrastructure : migration vers le cloud, optimisation des architectures, gestion des environnements hybrides. Data & Analytics : valorisation des données pour booster la performance et la prise de décision. Conseil & Support IT : accompagnement stratégique et technique pour garantir la réussite des projets. Solutions métiers : notamment dans la gestion des actifs et la GMAO, pour optimiser la maintenance et la performance opérationnelle. Notre ADN technologique : Méthodologies Agile et DevOps pour des livraisons rapides et fiables. Expertise sur des environnements Cloud (Azure, AWS) et solutions SaaS. Culture orientée sécurité, scalabilité et innovation continue. Pourquoi nous rejoindre ? Travailler sur des projets variés et stimulants avec des technologies de pointe. Évoluer dans une équipe passionnée, orientée collaboration et amélioration continue. Opportunités de formation et certifications pour booster votre carrière. Chez Onspark, nous croyons que la technologie est un levier stratégique pour créer de la valeur. Rejoignez nous pour façonner l’avenir du digital !