Une nouvelle étude scientifique menée par l'Oregon Health & Science University livre des résultats surprenants : ChatGPT et d'autres modèles d'IA obtiennent de meilleurs résultats que la majorité des étudiants aux tests de connaissances en informatique biomédicale.
Les faits les plus importants en quelques mots
- Les modèles d’IA ont obtenu de meilleurs résultats que 75 % des étudiants aux tests.
- Six modèles d’IA différents ont été testés.
- L’IA s’est montrée particulièrement performante sur les questions à choix multiples et les réponses écrites.
- Les résultats soulèvent des questions sur l’évaluation des performances académiques.
ChatGPT surpasse les humains
L’étude, publiée sur Nature.com, a comparé les résultats de 139 étudiants avec ceux de six modèles d’IA. Les chercheurs ont appliqué les IA à un cours d’introduction en ligne en informatique biomédicale et ont testé leurs performances sur des questions à choix multiples et des examens écrits. Les meilleurs modèles d’IA ont obtenu des résultats nettement supérieurs à ceux des trois quarts des étudiants. Même si tous les modèles d’IA n’ont pas eu la même réussite, ils se situaient tous dans la fourchette supérieure du tableau des résultats.
ChatGPT et compagnie exigent des conséquences
Selon les auteurs de l’étude, cela soulève des questions cruciales pour l’avenir de l’évaluation académique. En particulier, la possibilité de tricherie et l’influence de l’IA sur le comportement d’apprentissage doivent être considérées d’un œil critique. Le responsable de l’étude, le Dr William Hersh, souligne que même si les mises à jour continues dans les domaines scientifiques représentent un défi pour les modèles d’IA, de nouveaux formats d’examen sont nécessaires pour limiter l’influence de l’IA.
Les résultats de l’étude suggèrent que les institutions académiques doivent réfléchir à de nouvelles méthodes d’évaluation. Une adaptation des examens et des programmes semble inévitable pour contrôler l’influence des outils d’IA et garantir que les étudiants continuent d’acquérir de véritables connaissances.
Conclusion
L’étude montre que les modèles d’IA tels que ChatGPT peuvent surpasser les compétences humaines dans certains domaines. Les établissements d’enseignement doivent donc adapter leurs examens et considérer l’IA comme une aide ou un concurrent potentiel. Il devient donc de plus en plus important d’examiner de plus près l’utilisation de l’IA dans un contexte universitaire.