Un impact profond sur le monde des appareils. Et pourtant, ce n’est que la pointe de l’iceberg
Quelque chose à espérer: Maintenant que nous en sommes à la deuxième année du phénomène GenAI, il est temps de commencer à approfondir les implications de deuxième et troisième ordre de ce que cette révolution pourrait réellement apporter. Une question qui n’a cessé d’évoluer au cours de la dernière année est l’impact potentiel que l’IA générative aura sur les appareils matériels, comme les PC, les smartphones, les tablettes, les appareils portables et autres appareils.
Au départ, il semblait que ces appareils informatiques joueraient un rôle mineur puisque les premières applications et services GenAI étaient basés sur le cloud et accessibles comme n’importe quel site Web ou application classique. L’hypothèse était que les exigences informatiques pour ce type de charges de travail dépassaient de loin les capacités des systèmes informatiques personnels les plus avancés et ne pouvaient être gérées que par des méga centres de données basés sur le cloud.
Cependant, cette perspective a commencé à changer l’année dernière en raison de divers développements et du rythme rapide de l’évolution et des progrès dans le domaine GenAI. Notamment, l’introduction de plusieurs modèles de base comportant moins de 10 milliards de paramètres, capables de fonctionner dans les limites de mémoire et de calcul des appareils personnels, a marqué un changement significatif.
Des versions de Llama2 de Meta, Gemini de Google, Stable Diffusion de Stability AI et d’autres ont toutes été démontrées fonctionnant sur des PC ou des téléphones. Cela a suscité des spéculations sur les efforts déployés par des entreprises comme Microsoft, Apple et d’autres pour intégrer cette technologie dans les appareils du quotidien d’ici 2024.
Les progrès technologiques tels que la quantification et l’élagage des modèles, ainsi que des concepts tels que la génération augmentée par récupération (RAG), ont réorienté l’attention vers l’exécution de modèles de base et d’applications GenAI sur les appareils. Cette approche est désormais largement acceptée.
Lors de l’événement de lancement du Galaxy S24 de Samsung, nous avons observé certaines des premières implémentations réelles de l’IA sur l’appareil, y compris des fonctionnalités de traduction en temps réel. Cette année et l’année prochaine apporteront probablement de nombreux autres exemples de produits utilisant l’IA sur appareil.
En outre, l’introduction de capacités d’accélération matérielle de l’IA dans les nouveaux semi-conducteurs a été un moment fort. Qualcomm a lancé les choses avec des démos de modèles GenAI fonctionnant sur des processeurs mobiles Snapdragon 8 Gen 3. La société a poursuivi sur ce thème avec l’annonce de son processeur PC Snapdragon X Elite dont la sortie est prévue pour la mi-2024. AMD a lancé le SoC PC Ryzen 7040 avec son premier NPU Ryzen et a sorti plus récemment le 8040 mis à jour. Enfin, Intel a clôturé 2023 avec le lancement de son très attendu SoC Core Ultra, qui est le premier à intégrer un accélérateur d’IA dédié.
Tout aussi impressionnante que cette vague d’activité du côté des semi-conducteurs est le rythme accéléré auquel de nouveaux lancements sont attendus dans les mois à venir. AMD et Intel devraient disposer de puces PC plus puissantes avec de meilleurs accélérateurs d’IA avant la fin de l’année. Pour sa part, Microsoft a également fait allusion à plusieurs nouvelles fonctionnalités qui seront mises à profit sur les PC Windows. Et même si le sujet est resté remarquablement silencieux jusqu’à présent, Apple devrait avoir des nouvelles liées à GenAI sur le plan matériel et logiciel au moment de leur événement WWDC qui a généralement lieu début juin.
Prises ensemble, toutes ces avancées reflètent déjà un impact profond sur le monde des appareils. Et pourtant, je dirais qu’ils ne représentent que la pointe de l’iceberg. Premièrement, sur l’ensemble du marché, il existe des premiers signes encourageants selon lesquels les PC et téléphones IA revigoreront les ventes de ces catégories récemment en difficulté. L’impact le plus important ne se produira probablement pas avant la seconde moitié de 2024 et peut-être pas avant 2025, mais après une ou deux dernières années difficiles, c’est une excellente nouvelle.
Sur tous les appareils, cela nécessitera des éléments tels que des microphones de meilleure qualité, des capteurs plus nombreux et de meilleure qualité, ainsi que de nouveaux moyens plus simples de se connecter aux périphériques et autres appareils.
Nous devrions également nous attendre à des améliorations spectaculaires de la convivialité globale et des capacités de nos appareils grâce à GenAI. L’ajout d’éléments tels que des entrées vocales et gestuelles véritablement utilisables et fiables peut ouvrir toute une gamme de nouvelles applications et réduire les frustrations que de nombreuses personnes éprouvent avec leurs appareils actuels. Cela permettra également de créer de tout nouveaux types d’appareils, en particulier dans le monde des appareils portables, où la dépendance à l’égard des écrans pour l’interface utilisateur commencera à diminuer. Sur tous les appareils, cela nécessitera des éléments tels que des microphones de meilleure qualité, des capteurs plus nombreux et de meilleure qualité, ainsi que de nouveaux moyens plus simples de se connecter aux périphériques et autres appareils.
Je m’attends également à voir de nouveaux types d’architectures logicielles, telles que des applications distribuées qui effectuent une partie de leur travail sur le cloud et une autre sur l’appareil. En fait, je pense que ce concept d’IA hybride s’avérera être l’un des principaux moyens d’exécuter des applications GenAI sur des appareils au cours des prochaines années, en particulier jusqu’à ce qu’il y ait une base installée plus large d’appareils dotés de coprocesseurs d’IA puissants et dédiés.
Nous nous dirigeons vers des temps intéressants et passionnants dans le monde des PC, des smartphones, des tablettes et des appareils portables.
Finalement, c’est exactement ce que nous aurons. Bien que l’on puisse initialement appeler ces nouveaux appareils des PC IA ou des smartphones IA, ils ne seront bientôt plus que des PC et des smartphones, et les capacités d’IA seront inhérentes et assumées.
Cela ressemble beaucoup à la naissance des graphiques et des GPU. Au départ, aucun PC (ou smartphone) ne disposait de puces graphiques dédiées, et ce fut un gros problème lorsque les premiers GPU ont commencé à y être intégrés. Désormais, chaque appareil dispose d’un certain niveau d’accélération graphique intégrée et quelques-uns, comme les PC de jeu, disposent toujours de GPU dédiés autonomes pour des besoins plus exigeants.
Je pense que presque exactement la même chose se produira avec les NPU et l’accélération de l’IA. La plupart des appareils bénéficieront d’un certain niveau d’accélération de l’IA d’ici deux à trois ans, mais certains continueront d’utiliser des processeurs d’IA dédiés pour des applications plus avancées.
En attendant, nous devrons comprendre comment nous pensons, parlons et catégorisons ces nouveaux types d’appareils informatiques influencés par GenAI. Il ne fait aucun doute que les choses pourraient devenir confuses pendant un certain temps, mais il est également clair que nous nous dirigeons vers des temps intéressants et passionnants dans le monde des PC, des smartphones, des tablettes et des appareils portables.
Bob O’Donnell est le fondateur et analyste en chef de TECHnalysis Research, LLC, une société de conseil en technologie qui fournit des services de conseil stratégique et d’études de marché au secteur technologique et à la communauté financière professionnelle. Vous pouvez le suivre sur X @bobodtech