CEA - Ingénieur(e) / DevOps services HPC H/F
CEA
Publiée le
02/04/2026
Contrat
CDI
Localisation
26 Rue de la Piquetterie 91680 Bruyères-le-châtel
Taille équipe
—
Missions clés
Déployer, maintenir et faire évoluer des services HPC et IA. · Assurer un support de niveau 3 pour le diagnostic et la résolution d'incidents. · Contribuer à la sélection et au paramétrage des services en fonction des usages. · Proposer des solutions pour faciliter le déploiement de chaînes de calcul scientifique. · Documenter les réalisations techniques pour les exploitants.
Profil recherché
Bac +5 (Master 2, Diplôme d'ingénieur), Bac +8 (Doctorat) · Autonomie · Relationnel · Travail en équipe · Flexibilité
Outils & compétences
CPU, GPU, Kubernetes, Bash, Python, C, Rust, Go, Slurm, MPI, CUDA
Le poste en détail
Le complexe de calcul du CEA/DAM Ile-de-France est implanté sur le site de Bruyères-le-Chatel en Essonne. Il est principalement constitué des centres de calcul TERA/EXA (programme Simulation), TGCC/CCRT (recherches académiques française et européenne, recherches industrielles) et CCMD (Centre de Calcul Mutualisé Défense). Nos équipes IT au CEA/DAM assurent la qualité et la continuité des services proposés sur ces machines. Elles déploient des technologies à l’état de l’art en matière de CPU/GPU, d'architecture et infrastructure IT, systèmes d'exploitation et virtualisation, réseaux et stockage, services d'accès et solutions de calcul scientifique et d'intelligence artificielle. Elles veillent à la sécurité et à la bonne utilisation des ressources. Elles assurent une veille technologique active et continue. Elles contribuent également à la communauté Open Source mondiale. Dans ce cadre, vos missions seront les suivantes : Prendre en charge le déploiement, la maintenance et l'évolution d'un portefeuille de services à destination des utilisateurs HPC et IA : ordonnanceur de tâche, moteurs de workflows, forges logicielles, environnements interactifs, services d'API, interfaces cloud, authentification et gestion d'identité. Une partie de ces services repose sur un historique technique en cours d'évolution vers des pratiques modernes : déploiement continu, conteneurisation et orchestration Kubernetes. Vous serez moteur de cette modernisation sur un parc multi-clusters ;documenter l’ensemble de vos réalisations techniques, en particulier des gammes à destination des exploitants de niveau 1 et 2 ;Assurer un support de niveau 3 concernant le diagnostic et la résolution d'incidents sur l'ensemble des services déployés ;Contribuer à la sélection, la conception et au paramétrage des services en fonction de l'évolution des usages ;Proposer des solutions permettant de faciliter le déploiement et le suivi d'exécution de chaînes de calcul scientifique complexes faisant intervenir des applications variées ;Etablir et communiquer les bonnes pratiques permettant une utilisation optimale des ressources de calcul avec les services déployés.