Nommé Frugalia, ce projet est un partenariat entre d’un côté deux entreprises, DRI, donc, et EasyVirt, spécialiste nantais de la mesure de l’impact environnemental des infrastructures numérique, et de l’autre l’école d’ingénieurs IMT Atlantique, elle aussi nantaise.
Il se focalise sur les modèles de langues (LLM) hébergés par DRI, qu’il s’agisse de modèles open source ou de connexions aux API de modèles propriétaires. « Le projet pose la question de la mesure de la consommation énergétique d’un LLM mais aussi de la manière de la réduire », résume Dimitri Saingre, ingénieur de recherche en informatique à l’IMT Atlantique.
L’enjeu consiste à comprendre le comportement des modèles selon leur taille mais aussi ce qui contribue à leur consommation, notamment en variant les différents paramètres (quand on change une carte graphique par exemple), pour améliorer à terme la configuration des infrastructures.
Equilibre pertinence/consommation
Ces travaux devraient mener à la mise au point d’un modèle mathématique prédictif. L’idée ? Quand un nouveau LLM arrive sur un datacenter, pouvoir prédire, sans procéder à des mesures, sa consommation énergétique. A partir de là, un client pourra choisir le LLM le plus pertinent parmi ceux proposés par DRI. « Aujourd’hui chez DRI, vous pouvez choisir le LLM que vous voulez sur un portail, continue Dimitri Saingre. Peut-être qu’à l’avenir, on n’utilisera pas spécifiquement tel modèle mais plutôt celui qui propose un bon équilibre entre capacité à répondre à une requête et consommation de ressources. » Et cette proposition sera automatisée de façon transparente si le client le désire. C’est le volet appelé « routage » du projet Frugalia, prévu pour commencer l’année prochaine.
Preuve que le sujet prend de l’importance, la structure franco-suisse NeoMundi a lancé récemment une méthodologie de mesure du comportement des LLM. Avec, entre autre critères, la possibilité de baser une gouvernance des IA sur le coût énergétique des contenus générés.
La troisième dimension du projet Frugalia est celle qui reste la plus sensible dans les recherches sur la frugalité de l’IA ou du numérique en général : celle des usages. « L’optimisation ne fait pas tout, l’utilisateur lui-même doit faire acte de sobriété pour réduire la consommation des LLM », souligne Thomas Ledoux, enseignant chercheur en informatique à l’IMT Atlantique.
Deux phases de calcul
Le projet n’a pas vocation a entraîner un nouveau LLM, mais à travailler sur l’inférence. A savoir : définir des formulations de prompts (les requêtes adressées à un modèle de langue) qui génèrent les réponses pertinentes tout en étant les plus brèves possibles. Donc moins consommatrices en calcul. « Car ces modèles ont deux phases de calcul, précise Dimitri Saingre. L’une pour comprendre la requête, l’analyser, l’autre pour émettre la réponse. »
Une solution serait par exemple de condenser la requête d’un utilisateur avant qu’il ne l’envoie, pour que, derrière, la réponse soit brève.
Début juin 2026, un rapport de l’Institut de l’Eau, de l’Environnement et de la Santé de l’Université des Nations Unies ne disait pas autre chose. Le document estimait que si les utilisateurs d’agents conversationnels réduisaient les « merci » et autres « s’il te plaît » inutiles quand on parle à un programme informatique, 87 à 98 gigawattheures par an pourraient être économisés. Soit « l’équivalent de la consommation annuelle d’électricité de 760.000 personnes en Afrique sub-saharienne ».
« Cela peut paraître risible, ajoute Dimitri Saingre, mais si vous avez obtenu votre réponse, ajouter un ‘merci’ revient à envoyer une nouvelle requête. Et l’agent IA va réanalyser toute la conversation pour produire une réponse. » De quoi faire chauffer encore un peu plus les datacenters.
Source:
www.sciencesetavenir.fr



