Comment ordonnancer les calculs en prenant en compte la consommation d'énergie et les leviers disponibles.
Le besoin en puissance de calcul concerne de plus en plus de domaines tels que la biologie, la météorologie, l’astrophysique … Les applications sont exécutées sur des supercalculateurs avec de grandes capacités de calcul.
La puissance de calcul qui vient avec les supercalculateurs est souvent liée à une forte consommation énergétique. En effet, El Capitan, le supercalculateur le plus puissant au monde (Top500) consomme 29,6MW (un chiffre qui peut probablement être doublé en considérant le système de refroidissement). Ceci est équivalent à la consommation d’une ville française d’environ 55000 foyers.
De plus en plus de travaux se concentrent sur la réduction de la puissance et/ou de l’énergie consommée. Ces travaux se basent sur la modification de paramètres de l’architecture qui impactent directement la puissance et l'énergie (telle que la fréquence des processeurs [1,2,3] ou le power capping[4]).
Dans ce stage, nous nous proposons d'étudier comment intégrer ces mécanismes (power capping, uncore frequency scaling) impacte les décisions des algorithmes d’ordonnancement. Ces algorithmes sont ceux implémentés (ou qui le seront à la suite du stage) dans StarPU [5], un support d’exécution à base de tâches développé à Bordeaux. StarPU ne propose pour l’heure actuelle pas d’algorithmes d’ordonnancement pour réduire la consommation d'énergie. Cependant, des travaux en cours vont permettre de proposer de tels algorithmes avec une connaissance fine de la consommation de chaque tâche exécutée. Ces algorithmes vont principalement viser des techniques de placement. Le but du stage est donc d’ajouter une dimension supplémentaire qui vise à ajouter d’autres métriques (gestion de la fréquence et du budget de consommation aussi appelé power capping.)
Le stage commencera par une prise en main de la plate-forme utilisée pour les expériences (grid5000) ainsi que les techniques d’estimation de la consommation énergétique des tâches présentée ici [6]. Ensuite, l'étudiant commencera à étudier les algorithmes d’ordonnancement existants. Enfin, l’impact des facteurs tels que le power capping seront étudiés dans le but d'étendre les politiques d’ordonnancement. Les architectures visées dans ce contexte sont des architectures CPU+GPU.
HPC, puissance, énergie, power capping, ordonnancement
Inria de l’Université de Bordeaux
[1] B. Rountree, D. K. Lownenthal, B. R. de Supinski, M. Schulz, V. W. Freeh, and T. Bletsch, “Adagio: making dvs practical for complex hpc applications,” in ICS, 2009, pp. 460–469. [2] Gholkar, N., Mueller, F., Rountree, B.: Uncore power scavenger: A runtime for uncore power conservation on hpc systems. In: SC’19 (2019). [3] Étienne André, Rémi Dulong, Amina Guermouche, François Trahay. duf: Dynamic uncore frequency scaling to reduce power consumption. Concurrency Computat Pract Exper. 2022; 34( 3):e6580. [4] Amina Guermouche. Combining Uncore Frequency and Dynamic Power Capping to Improve Power Savings. In IPDPSW’22 (2022) [5] Cédric Augonnet, Samuel Thibault, Raymond Namyst, and Pierre-André Wacrenier. StarPU: A Unified Platform for Task Scheduling on Heterogeneous Multicore Architectures. CCPE - Concurrency and Computation: Practice and Experience, Special Issue: Euro-Par 2009, 23:187-198, February 2011 [6] Jules Risse, Amina Guermouche, François Trahay. Fine-grain energy consumption modeling of HPC task-based programs. Cluster 2025.