Une grande puissance de calcul gênée par de mauvais choix d’interface mémoire ?
Pourquoi est-ce important: La mystérieuse architecture CPU utilisée par Pékin pour ses supercalculateurs a désormais été détaillée. Une nouvelle version du processeur Sunway SW26010 améliore considérablement la capacité de la puce à traiter les chiffres, mais cela ne signifiera probablement pas la fin des prouesses occidentales dans le secteur HPC, du moins pas encore.
Sunway SW26010 Pro est le dernier processeur fabriqué en Chine pour les machines de calcul haute performance (HPC), une puce précédemment utilisée dans le supercalculateur Sunway TaihuLight. La série de processeurs Sunway (ou Shenwei) est basée sur un RISC ISA apparemment personnalisé et utilise une architecture multicœur pour fournir le degré élevé de traitement parallèle nécessaire aux charges de travail HPC.
Des chercheurs chinois ont fourni des détails juteux et inconnus sur les processeurs Sunway lors de la Conférence internationale SC23 sur le calcul haute performance, soulignant à quel point la technologie a évolué rapidement au cours des dernières années. Sunway SW26010 Pro est apparemment quatre fois plus puissant que la puce SW26010. Il fonctionne plus rapidement et possède plus de cœurs avec des largeurs vectorielles plus larges.
Chaque puce Sunway SW26010 Pro a apparemment un débit maximum au format à virgule flottante double précision (FP64) de 13,8 TFLOPS, ce qui serait un résultat assez remarquable lorsqu’un processeur AMD EPYC 9654 a une performance FP64 maximale d’environ 5,4 TFLOPS. La puce utilise la même architecture RISC 64 bits de base que la génération précédente, apportant bien sûr quelques améliorations clés ici et là.
Chaque processeur SW26010-Pro comprend un total de 384 cœurs de calcul, regroupés dans six groupes de cœurs (CG) différents. Un élément de traitement de gestion (MPE) distinct fournit un cœur superscalaire hors service avec un moteur vectoriel pour gérer le trafic informatique, qui passe finalement par une maigre interface mémoire DDR4-3200 de 128 bits.
La puce fait tout son possible pour réduire les mouvements de données entre les cœurs, et ce avec une horloge de 2,25 GHz pour les cœurs de calcul et une horloge de 2,10 pour le MPE. Le précédent processeur Sunway SW26010 était doté d’une horloge de 1,45 GHz pour les cœurs et le MPE. Le contrôleur de mémoire DDR3 précédemment utilisé a également été remplacé par de la mémoire DDR4, ce qui augmente la quantité totale de RAM prise en charge par un processeur de 32 Go à 96 Go.
Bien que le SW26010-Pro soit apparemment capable d’apporter une amélioration technologique significative à la recherche HPC en Chine, les choix inhabituels en matière d’interface de cache et de mémoire ne fourniront probablement pas de résultats exceptionnels à la recherche avancée du pays. Le nouveau supercalculateur basé sur SW26010 Pro semble avoir été conçu dans le but ultime de gagner gros dans la liste TOP500, et non de résoudre plus rapidement les problèmes informatiques modernes.