OpenAI a publié son agent AI avancé, l'opérateur, pour Chatgpt Pro utilisateurs de l'Union européenne ainsi que de la Suisse, de la Norvège, du Liechtenstein et de l'Islande. Cette extension permet aux utilisateurs de bénéficier des capacités autonomes de l'opérateur, qui est en mesure d'effectuer des tâches complexes sur Internet en soi.
Caractéristiques clés de l'opérateur OpenAI:
- Navigation Web autonome: L'opérateur peut exploiter indépendamment un navigateur Web pour effectuer des tâches telles que les achats en ligne ou la recherche sur l'information.
- Intégration avec les services en ligne: En coopérant avec des plates-formes telles que Instacart, Booking, Expedia, Uber et StubHub, l'opérateur peut organiser de manière transparente les services pour l'utilisateur.
- Base technologique: L'opérateur est basé sur l'agent d'utilisation informatique (CUA), qui utilise la fonction de vision de GPT-4O et a été amélioré par l'apprentissage du renforcement pour interagir avec les interfaces utilisateur graphiques.
Navigation Web et gestion des tâches autonomes
L'opérateur est conçu pour gérer de manière autonome des tâches complexes et en plusieurs étapes en les décomposant en étapes individuelles. Un exemple pratique est les achats en ligne: si un utilisateur dit à l'opérateur quel plat il souhaite préparer, l'agent recherche indépendamment des recettes appropriées et commande les ingrédients requis d'un épicier.
Mise à jour de l'opérateur
Il est maintenant disponible pour tous les utilisateurs professionnels de l'UE, de la Suisse, de la Norvège, du Liechtenstein et de l'Islande. https://t.co/aw0gijhzch
– Openai (@openai) 13 mars 2025
Cette capacité de navigation Web autonome permet à l'opérateur d'effectuer une variété de tâches sur Internet sans que l'utilisateur n'aye à effectuer chaque étape manuellement.
Base technologique et mode de fonctionnement
L'opérateur utilise l'agent d'utilisation informatique (CUA), un modèle basé sur la fonction de vision de GPT-4O et complété par des capacités de raisonnement supplémentaires développées à l'aide de l'apprentissage par renforcement. Cette formation permet à l'opérateur d'interagir avec les interfaces utilisateur graphiques, ce qui lui permet d'utiliser des commandes conventionnelles telles que les boutons, les menus et les champs d'entrée de texte. Contrairement aux systèmes qui reposent sur des API spécifiques, l'opérateur agit de manière indépendante et flexible, le navigateur Web directement intégré.
Statut de développement actuel et Outlook
L'opérateur est actuellement dans une version d'aperçu (prévisualisation de recherche) et est proposé comme un outil autonome. Cependant, OpenAI prévoit d'intégrer l'opérateur directement dans Chatgpt à l'avenir et également d'accès aux utilisateurs des abonnements Pays Plus, Team et Enterprise. Bien que l'opérateur affiche déjà des capacités impressionnantes, les utilisateurs sur des plates-formes telles que Reddit rapportent que le système a toujours des bogues et est considéré comme une démonstration technique qui nécessite des améliorations supplémentaires.
En étendant l'accès à l'opérateur aux utilisateurs européens de Chatgpt Pro, Openai fait un pas significatif vers les tests et le développement des capacités des agents de l'IA dans la vie quotidienne. Il reste à voir comment l'opérateur prouve lui-même dans la pratique et quelles autres fonctions seront implémentées dans les versions futures.