Stimulateur de productivité ou destructeur d’emplois ?
Faire rapidement au dépens de la qualité: Les tableurs sont devenus indispensables à de nombreux emplois et secteurs d’activité, et il est presque impossible de quantifier leur valeur économique. Les personnes qui maîtrisent cet outil sont très demandées et souvent bien rémunérées. Microsoft a créé une fonctionnalité qui a le potentiel de supprimer certains emplois tout en libérant les utilisateurs de l’analyse fastidieuse des données.
Microsoft a développé un framework appelé SpreadsheetLLM qui utilise de grands modèles de langage pour analyser et interpréter les données des feuilles de calcul. L'outil est conçu pour relever les défis auxquels sont confrontés les LLM traditionnels lorsqu'ils traitent des feuilles de calcul, comme la gestion de grilles bidimensionnelles étendues, des mises en page flexibles et des options de formatage variées. Il résout ce problème en sérialisant les données et en incorporant les adresses, les valeurs et les formats des cellules dans un flux de données.
L'outil comprend un composant qui compresse les feuilles de calcul pour les LLM. Il se compose de trois modules : l'un analyse la structure de la feuille de calcul et élimine le contenu non tabulaire ; un autre traduit les données en une représentation plus efficace ; et un troisième agrège les données.
SpreadsheetLLM présente certaines limitations dans sa forme actuelle. Par exemple, il ignore les couleurs d'arrière-plan des cellules, qui peuvent transmettre une certaine signification à la feuille. Il manque également une compression sémantique pour les cellules contenant du langage naturel.
Malgré ses faiblesses, il semble être très efficace. Lors des tests, il a surpassé les approches traditionnelles de 25,6 % dans le cadre de l'apprentissage en contexte de GPT-4. De plus, SheetCompressor réduit de 96 % l'utilisation de jetons pour l'encodage des feuilles de calcul, ce qui diminue considérablement les coûts de calcul. SpreadsheetLLM est également très efficace pour la détection des tableaux de feuilles de calcul, ce qui est fondamental pour la compréhension des feuilles de calcul. Cet outil pourrait rationaliser le traitement des données dans plusieurs secteurs.
Si cet outil vous semble être un outil capable de remplacer certains emplois, vous avez probablement raison, notamment dans les postes de comptabilité et d'analyse de données. SpreadsheetLLM pourrait permettre aux utilisateurs non techniques d'interroger et de manipuler les données des feuilles de calcul à l'aide d'invites en langage naturel avec peu de connaissances sur le fonctionnement des feuilles.
Il est impossible d’estimer l’impact sur l’emploi, car le secteur de l’IA/LLM est encore en plein essor. Les postes dans de nombreux secteurs reposent largement sur des feuilles de calcul, en particulier Microsoft Excel. Ces postes sont très valorisés et bénéficient d’une rémunération proportionnelle. Une étude portant sur près de 27 millions d’offres d’emploi a révélé que les compétences en Microsoft Excel étaient les compétences logicielles les plus recherchées.
Il est également logique qu'il puisse compléter, plutôt que remplacer, certaines tâches dans les domaines de la finance, de la comptabilité et d'autres domaines à forte intensité de données. Par exemple, le modèle introduit un cadre de « chaîne de feuilles de calcul » (CoS), qui peut décomposer le raisonnement des feuilles de calcul en un pipeline de « détection-correspondance-raisonnement » de table.
Ce qui est peut-être plus intrigant, c'est la capacité du modèle à travailler avec des données de tableur structurées et non structurées. Selon les chercheurs, cet aspect pourrait potentiellement réduire les hallucinations dans les résultats générés par l'IA, la feuille de calcul servant de « source de vérité » pour améliorer la fiabilité de l'analyse assistée par l'IA.
Toutefois, SpreadsheetLLM n'est pas encore prêt à être lancé au grand public. Il est encore en phase de recherche et trop brut pour être intégré dans des produits commerciaux comme Microsoft Excel.