Une solution rentable pour gérer les capacités d’IA dans les appareils distribués
Pourquoi est-ce important: Alors que les algorithmes d’IA sont apparemment partout, le traitement sur les plates-formes les plus populaires nécessite de puissants GPU de serveur pour fournir aux clients leurs services génératifs. Arm présente une nouvelle conception de puce dédiée, destinée à fournir une accélération de l’IA même dans les appareils IoT les plus abordables à partir de l’année prochaine.
L’Arm Cortex-M52 est le processeur le plus petit et le plus rentable conçu pour les applications d’accélération de l’IA, selon la société. Cette dernière conception de la société sans usine basée au Royaume-Uni promet de fournir des capacités d’IA « améliorées » aux appareils Internet des objets (IoT), comme l’indique Arm, sans avoir besoin d’une unité informatique séparée.
Paul Williamson, vice-président directeur d’Arm et directeur général de l’activité IoT de l’entreprise, a souligné la nécessité d’apporter un traitement optimisé pour l’apprentissage automatique aux terminaux « même les plus petits et les plus économes » afin de réaliser pleinement le potentiel de l’IA dans l’IoT. Malgré l’omniprésence de l’IA, a noté Williamson, exploiter « l’intelligence » des grandes quantités de données circulant via les appareils numériques nécessite des appareils IoT plus intelligents et plus performants.
La conception de la puce Cortex-M52 intègre la technologie Arm’s Helium, ajoutant 150 nouvelles instructions scalaires et vectorielles à la gamme Armv8.1-M Cortex-M (y compris Cortex-M55, Cortex-M85). Par rapport à la génération Cortex-M précédente, les instructions Helium peuvent fournir jusqu’à 5,6 fois plus de performances dans les algorithmes d’apprentissage automatique et jusqu’à 2,7 fois plus de performances pour les charges de travail de traitement du signal numérique (DSP).
La sécurité reste un aspect critique, comme l’explique Arm. Cortex-M52 implémente les dernières extensions de sécurité pour Armv8.1-M (PACBTI, Arm TrustZone). La nouvelle conception de la puce facilite également un « flux de développement moderne », selon Arm, donnant aux développeurs l’accès à une chaîne d’outils unifiée pour la plate-forme Cortex-M avec une prise en charge complète des flux de travail d’IA.
Avant le Cortex-M52, les développeurs devaient utiliser une combinaison d’unités CPU, DSP et NPU avec trois boîtes à outils logicielles différentes pour atteindre les performances ML et DSP désormais fournies nativement par la nouvelle conception.
Arm déclare qu’une seule chaîne d’outils suffit désormais. Cortex-M52 est entièrement compatible avec les logiciels écrits pour Cortex-M55 et Cortex-M85, et la nouvelle puce sera également disponible via la plateforme cloud Arm Virtual Hardware pour le développement de logiciels pré-silicium.
La technologie Cortex-M52 peut faire l’objet d’une licence pour être intégrée dans des produits IoT à très faible coût, les puces coûtant entre 1 et 2 dollars représentant probablement la majorité de la production, selon Williamson. Il a ajouté que la puce peut également être intégrée à des appareils IoT « légèrement plus riches » et plus performants.