L’outil peut utiliser le contenu généré par l’IA pour créer davantage de contenu IA et former d’autres IA
De l’autre côté du miroir: L’IA générative est surtout connue pour créer du texte et des images statiques d’une crédibilité alarmante, et les outils ont commencé à assembler des clips vidéo assez réalistes. Les expériences interactives, notamment les jeux, pourraient constituer l’une des prochaines étapes. Les recherches de Google pourraient permettre à l’IA d’avoir un impact sur la construction de mondes virtuels, en utilisant l’IA pour former l’IA.
Google DeepMind a récemment dévoilé Genie, un modèle d’IA capable de créer de petits jeux interactifs à partir d’images statiques. Google affirme que la base de cette technologie peut faciliter d’autres applications, comme la formation de robots alimentés par l’IA.
Genie a été formé sur environ 200 000 heures de séquences de jeu accessibles au public (probablement provenant de YouTube, filiale de Google). Il n’est pas clair si quiconque l’utiliserait pourrait rencontrer des problèmes de droits d’auteur avec les créateurs de ces jeux.
Remarquablement, l’IA n’a pas besoin de texte ou de balises d’action pour interpréter ce qu’elle voit. Il fonctionne uniquement à partir d’images vidéo, déchiffrant quels éléments doivent servir de terrain et lesquels doivent servir d’avatar contrôlable. Genie peut également interpréter la profondeur tridimensionnelle des images pour émuler le défilement parallaxe dans le jeu résultant.
L’outil peut créer de petits niveaux de jeu vidéo à partir de peintures, de croquis, de rendus, de photos et d’autres types d’images. Étant donné que Genie peut travailler avec des images qu’il n’a jamais vues auparavant, il peut également créer des environnements à partir de contenu généré par l’IA, ouvrant ainsi la possibilité d’utiliser le contenu d’une IA pour créer quelque chose dans une autre IA.
Il y a cependant place à amélioration. Comme les autres modèles d’IA, Genie est capable d’halluciner. De plus, cette itération initiale ne peut mémoriser que jusqu’à 16 images, ce qui limite considérablement la taille des niveaux qu’elle peut construire tout en restant cohérente. La vitesse de fonctionnement de 1 ips du modèle laisse également beaucoup de place à l’amélioration.
Pour garantir l’exactitude, la démonstration initiale de Genie se concentre sur la réplication de jeux de plateforme 2D. Cependant, Google suggère qu’il pourrait être formé pour créer d’autres types de jeux et de contenus virtuels.
Par exemple, Google a déclaré que Genie pouvait aider à entraîner certains robots plus efficacement. La formation utilisant des simulations artificielles offre une variété limitée de scénarios, mais Genie peut créer une gamme beaucoup plus large d’environnements et d’objets virtuels à partir desquels le robot peut apprendre.
Grâce à des développements ultérieurs, Genie pourrait transformer les décors interactifs en le prochain domaine majeur de l’IA générative. Les vidéos deviennent actuellement un objectif central, surtout depuis qu’OpenAI a dévoilé Sora le mois dernier, qui peut créer des clips réalistes de 60 secondes en 1080p. Sans surprise, les images générées par l’IA ne sont pas parfaites, mais elles représentent un bond en avant significatif pour la technologie.