Si Google implémentait la technologie dans chaque recherche
Prospectif : Nous entendons de nombreuses inquiétudes légitimes concernant la nouvelle vague d’IA générative, depuis les emplois humains qu’elle pourrait remplacer jusqu’à son potentiel de création de désinformation. Mais un aspect souvent négligé est la quantité d’énergie consommée par ces systèmes. Dans un avenir pas si lointain, cette technologie pourrait consommer la même quantité d’électricité qu’un pays entier.
Alex de Vries, chercheur à la Vrije Universiteit Amsterdam, est l’auteur de « L’empreinte énergétique croissante de l’intelligence artificielle », qui examine l’impact environnemental des systèmes d’IA.
De Vries note que la phase de formation pour les grands modèles de langage est souvent considérée comme la plus énergivore et a donc fait l’objet de recherches sur la durabilité dans le domaine de l’IA.
Après la formation, les modèles sont déployés dans un environnement de production et commencent la phase d’inférence. Dans le cas de ChatGPT, cela implique de générer des réponses en direct aux requêtes des utilisateurs. Peu de recherches ont été consacrées à la phase d’inférence, mais De Vries estime que certains éléments indiquent que cette période pourrait contribuer de manière significative aux coûts du cycle de vie d’un modèle d’IA.
Selon le cabinet de recherche SemiAnalysis, OpenAI avait besoin de 3 617 serveurs Nvidia HGX A100, avec un total de 28 936 GPU, pour prendre en charge ChatGPT, ce qui implique une demande énergétique de 564 MWh par jour. À titre de comparaison, environ 1 287 MWh ont été utilisés dans la phase de formation de GPT-3, de sorte que les demandes énergétiques de la phase d’inférence étaient considérablement plus élevées.
Google, qui a rapporté que 60 % de la consommation d’énergie liée à l’IA de 2019 à 2021 provenait de l’inférence, intègre des fonctionnalités d’IA dans son moteur de recherche. En février dernier, le président d’Alphabet, John Hennessy, a déclaré qu’un échange entre utilisateur unique avec un service de recherche basé sur l’IA « coûtait probablement dix fois plus cher qu’une recherche par mot clé standard ».
SemiAnalysis estime que la mise en œuvre d’une IA similaire à ChatGPT dans chaque recherche Google nécessiterait 512 821 serveurs A100 HGX, totalisant 4 102 568 GPU. Avec une demande de puissance de 6,5 kW par serveur, cela se traduirait par une consommation électrique quotidienne de 80 GWh et une consommation annuelle de 29,2 TWh, soit à peu près la même quantité utilisée par l’Irlande chaque année.

Il est peu probable qu’un tel scénario se produise dans un avenir proche, notamment parce que Nvidia n’a pas la capacité de production nécessaire pour livrer plus d’un demi-million de serveurs HGX et que leur achat coûterait à Google 100 milliards de dollars.
Loin de toute hypothèse, le document note que le leader du marché, Nvidia, devrait livrer 100 000 de ses serveurs IA en 2023. S’ils fonctionnaient à pleine capacité, ces serveurs auraient une demande de puissance combinée de 650 à 1 020 MW, consommant jusqu’à 5,7 à 8,9 TWh d’électricité par an. C’est une quantité presque négligeable par rapport à la consommation annuelle des centres de données (205 TWh). Mais d’ici 2027, Nvidia pourrait expédier 1,5 million d’unités de serveurs IA, portant leur taux de consommation d’énergie annuel jusqu’à 85,4 – 134,0 TWh. C’est à peu près le même montant qu’un pays comme l’Argentine, les Pays-Bas ou la Suède.
« Il serait conseillé aux développeurs non seulement de se concentrer sur l’optimisation de l’IA, mais aussi d’examiner d’un œil critique la nécessité de l’utiliser en premier lieu, car il est peu probable que toutes les applications bénéficient de l’IA ou que les avantages dépassent toujours les coûts. « , a déclaré De Vries.



