Nouveaux serveurs, ordinateurs portables, stockage et mise en réseau pour les charges de travail d'IA
Prospectif : Susciter l’intérêt des entreprises pour le déploiement d’applications d’IA générative n’est plus un défi pour les fournisseurs de technologie. Cependant, il reste difficile pour bon nombre de ces clients professionnels de déterminer comment utiliser au mieux la technologie. Une nouvelle technique évoquée par Dell lors de son événement Dell Tech World à Las Vegas est le concept d'IA hybride, dans lequel une partie du travail s'effectue dans le cloud, mais une autre partie est effectuée sur site, au sein des centres de données d'une organisation.
Étant donné que la plupart de leurs données sont toujours stockées dans leurs propres installations informatiques (83 % selon Dell), il est logique d'intégrer l'IA aux données plutôt que de déplacer leurs données vers le cloud.
Pour ce faire, Dell a évoqué l’idée d’une usine d’IA, où les entreprises peuvent rassembler les différents composants dont elles ont besoin pour exécuter des projets d’IA. Pour Dell, une usine d'IA peut être comprise comme une infrastructure compatible GenAI conçue pour permettre le réglage fin des modèles de base, les charges de travail d'inférence de données et la création d'applications personnalisées exploitant ces modèles personnalisés.
De plus, la vision de l'usine IA de Dell rassemble des services et même des appareils clients qui peuvent tous faire partie de la stratégie IA d'une organisation.
Aux premiers stades de la révolution GenAI, la possibilité d'exécuter des modèles de base au sein d'un centre de données d'entreprise n'était pas possible car des outils tels que GPT-3 et GPT-4 n'étaient accessibles que via le cloud. Cependant, récemment, de plus en plus d'entreprises profitent de modèles de fondation open source, tels que Llama 3 de Meta et de nombreuses options du marché de l'IA open source Hugging Face.
Ces modèles peuvent être exécutés dans les centres de données d'entreprise, ce qui permet aux entreprises de les affiner plus facilement et de manière plus rentable avec leurs propres données, puis de créer des applications personnalisées autour de ces modèles auto-réglés.
Bien entendu, pour ce faire, vous avez besoin du bon type de matériel informatique, de capacités de stockage et de mise en réseau, ainsi que d’outils logiciels et, surtout, de services conçus pour aider les organisations à réussir leur parcours GenAI.
Et c'est ce que Dell a présenté au Tech World de cette année. S'appuyant sur les annonces exclusives faites avec Nvidia lors de l'événement de l'année dernière, Dell a lancé une gamme plus large de produits et de services qui permettent aux entreprises de choisir parmi une gamme plus large de fournisseurs de composants et de logiciels de base pour construire leur propre infrastructure compatible GenAI. Dans le même temps, Dell a également étendu ses offres spécifiques à Nvidia, en intégrant les nouveaux GPU à architecture Blackwell, les conceptions de systèmes et les nouveaux logiciels annoncés par Nvidia au GTC.
Côté infrastructure, Dell a dévoilé plusieurs nouveaux serveurs, dont une version refroidie par liquide de son châssis compact XE9680, nommé à juste titre XE9680L, qui peut contenir jusqu'à 8 GPU Nvidia.
Il a également présenté le PowerScale F910, une baie de stockage 100 % Flash optimisée pour accélérer l'accès aux grands ensembles de données nécessaires aux charges de travail GenAI. De plus, la société a présenté en avant-première Project Lightning, un système de fichiers parallèle optimisé pour PowerScale. Le PowerSwitch Z9864F-ON est un commutateur réseau offrant des vitesses de débit deux fois supérieures sur les charges de travail GenAI par rapport à ses offres précédentes. De même, Dell a annoncé de nouveaux adaptateurs Ethernet 400G PCIe Gen 5.0 alimentés par Broadcom pour ses serveurs PowerEdge XE9680. Encore plus intéressante a été l'annonce d'un nouveau Dell Enterprise Hub sur Hugging Face, conçu pour simplifier le processus de sélection des bons LLM et autres outils logiciels pour créer des applications GenAI personnalisées.
Dell a également annoncé de nouveaux travaux avec Meta sur ses modèles Llama 3 et avec Microsoft pour proposer une solution Dell pour les services Microsoft Azure AI. À tout cela s’ajoutait un ensemble complet de nouvelles offres de services pour aider les organisations à comprendre comment utiliser au mieux tous ces nouveaux outils.
Au-delà de l’infrastructure d’IA traditionnelle, Dell a également évoqué la possibilité d’apporter des capacités d’IA sur site via les postes de travail et les PC. Du côté des PC, Dell a dévoilé 5 nouveaux PC accélérés par l'IA Copilot+ – le plus grand nombre parmi tous les constructeurs de PC – dans le cadre du grand événement de Microsoft.
La société a dévoilé son tout premier XPS 13 sans processeur Intel, ainsi que deux nouveaux Inspiron et deux nouveaux Latitudes. Ce grand nombre de systèmes met en évidence le fait que la société parie gros sur les SoC Qualcomm Snapdragon X Elite et X Plus alimentés par Arm qui alimentent ces appareils.
Comme d'autres acteurs de l'industrie informatique, Dell estime que la combinaison d'un nouveau NPU puissant pour accélérer les charges de travail d'IA, ainsi que d'énormes améliorations de la durée de vie de la batterie, s'avérera convaincante pour de nombreux utilisateurs.
Pour les acheteurs de PC professionnels, l’idée est que même s’ils n’ont pas initialement l’intention de tirer parti de l’accélération du NPU et de l’IA, il existe d’autres avantages importants. Plus précisément, les conceptions minces, les performances de calcul impressionnantes et la durée de vie de la batterie de plus de 24 heures de ces machines basées sur Snapdragon offriront une alternative solide aux utilisateurs finaux qui demandent les derniers MacBook ou qui sont simplement frustrés par la courte durée de vie de la batterie de certains. PC x86 existants.
Pour ceux qui s’intéressent aux capacités de l’IA, les choses deviennent encore plus intéressantes. Même si la prise en charge logicielle initiale de l'accélération NPU devrait être limitée, elle augmentera au fil du temps. En d’autres termes, les capacités de ces nouveaux PC s’amélioreront avec l’âge – ce n’est pas quelque chose dont nous entendons parler depuis longtemps.
La question de la compatibilité des applications et des performances d’émulation – deux problèmes qui ont fait couler les deux premières itérations de Windows on Arm – demeure. Cependant, les premiers rapports suggèrent que la nouvelle couche d'émulation Prism intégrée à Windows donne des résultats prometteurs, même pour les applications d'entreprise.
Outre les PC, l'une des annonces les plus intrigantes mais négligées de Dell concernait les postes de travail. Plus précisément, leur travail vise à permettre aux entreprises d'affiner leurs modèles open source avec RAG (Retrieval Augmented Generation) sur les stations de travail Precision AI de l'entreprise. RAG est l’un des domaines les plus en vogue de GenAI, et de nombreuses organisations sont très intéressées à l’exploiter pour leur propre usage.
Au total, Dell a rassemblé un ensemble d’annonces convaincantes offrant une nouvelle perspective sur la direction que prend le monde de GenAI dans l’entreprise. S'il ne fait aucun doute que la plupart des entreprises exploiteront le cloud pour une grande partie de leurs applications GenAI initiales, à mesure que le cloud hybride devient un moyen standard pour les entreprises d'exploiter l'informatique, l'IA hybride est également sur le point de devenir une option courante. Dell voit une opportunité d'être un pionnier sur ce marché, et ces derniers développements montrent qu'ils avancent de manière agressive dans cette direction.
Bob O'Donnell est le fondateur et analyste en chef de TECHnalysis Research, LLC, une société de conseil en technologie qui fournit des services de conseil stratégique et d'études de marché au secteur technologique et à la communauté financière professionnelle. Vous pouvez le suivre sur Twitter @bobodtech