Le Cned, opérateur public de l'enseignement à distance, est au cœur de l'innovation pour permettre à chacun d'apprendre et de se former avec les technologies d'aujourd'hui. L'établissement s'adresse à tous les publics (élèves, étudiants, enseignants, professionnels…) qu'ils soient en France ou à l'étranger. Il offre la possibilité de suivre à distance et en ligne une formation quel que soit son projet : scolarité initiale, reprise d'études dans l'enseignement secondaire, études supérieures, préparation de concours de la fonction publique ou de concours enseignants, formation professionnelle.
Chaque année, le Cned forme près de 240 000 inscrits générant ainsi de nombreuses traces numériques : données d’audience ou de connexion aux outils mis à la disposition des utilisateurs sur les plateformes du Cned et données liées à l’auto-apprentissage. Elles reflètent l’activité de chaque apprenant et notamment ses difficultés et ses acquis.
Sous la direction du/de la Directeur(trice) du Lab Innovation, le/la data scientist devra opérationnaliser la R&D et la production en IA selon les méthodologies d’Innovation et en étroite collaboration avec divers métiers. Il/elle devra également définir, mettre en œuvre et piloter des volets data, IA et participer activement à la mise en œuvre d’une infrastructure associée, dans un environnement encore en construction.
Il s’agit d’un poste au sein d’une équipe Innovation, entièrement autonome, sans équipe dédiée à court terme. Le ou la future recrue devra opérationnalises la démarche R&D data/IA : participer au cadrage stratégique, réaliser la conception technique, le développement et le prototypage en itérations courtes. Il/Elle devra co-construire la démarche d’industrialisation et d’intégration dans les systèmes existants
Le/la data scientist, conçoit, développe et déploie des modèles d'intelligence artificielle pour répondre aux besoins spécifiques de l'innovation. Ses principales responsabilités incluent la collaboration avec les métiers pour apporter une expertise technique dès la R&D, proposer et configurer une environnement technique adapté au prototypage de solutions. Le/la data scientist devra également comprendre et analyser les besoins métier, réaliser la collecte, le nettoyage et la préparation des données nécessaires à la modélisation, ainsi que la conception, le développement, le test et l'évaluation des modèles d'IA. Il/elle devra concevoir, entraîner et déployer des modèles LLM (Large Language Models) dans un cadre opérationnel. Il/elle devra les déployer et assurer leur intégration avec les systèmes existants.
Le poste requiert la capacité à mettre en place un environnement IA avancé, reproductible et optimisé GPU, depuis la configuration système (Ubuntu, CUDA, Docker) jusqu’au déploiement d’API exposant des LLM récents. Le candidat doit maîtriser les stacks MLOps modernes (Docker multi-étapes, gestion des dépendances, artefacts, automatisation), ainsi que la manipulation fine de modèles open-source (Mistral, LLaMA…) avec Transformers, LoRA, RAG. Il saura optimiser les pipelines de génération, intégrer les modèles dans des interfaces (Gradio/Streamlit) et assurer leur exposition réseau. Une expérience complète, de l’installation GPU au déploiement conteneurisé d’un LLM, est requise.
Le/la data scientist devra travailler en méthode lean start up en forte proximité avec des ingénieurs pédagogiques, UX Designer et chefs de produits. Il/elle devra avoir de l’expérience dans les méthodes d’innovation.
· Connaissances
· Statistiques et mathématiques
· Maîtrise des langages de programmation pour l’IA ainsi que des outils et bibliothèques spécialisées
· Manipulation et analyse de données
· Machine Learning, Deep learning
· Connaissance des données du domaine de l’éducation à distance
· Méthodes d’innovations
· Compétences opérationnelles
· Analyse et extraction de données, utilisation de bases de données
· Modélisation statistique, Machine learning
· Programmation
· Visualisation de données
· Résolution de problèmes, éthique et confidentialité des données
· Communication, acculturation en Data Science
· Veille scientifique en Data Science
· Gestion de projets
· Compétences comportementales
· Qualités relationnelles (communication, écoute, collaboration interdisciplinaire)
· Rigueur et sens de l’organisation
· Capacité d’adaptation
· Force de proposition et autonomie
Collaboration étroite avec :
· Interne :
· Les ingénieurs pédagogiques
· Les Chefs de produits
· La direction des systèmes d’information (DSI)
· La direction de la maîtrise d’ouvrage
· L’ensemble des directions métier et unités opérationnelles de l’établissement
· Externe :
· Les partenaires et prestataires externes