OpenAI pourrait bientôt publier un outil d’IA capable de prendre le contrôle des PC des utilisateurs et d’effectuer des actions en leur nom, appelé outil Operator. L’ingénieur logiciel Tibor Blaho, connu pour avoir divulgué avec précision les prochains produits d’IA, réclamations avoir trouvé des preuves appuyant cette évolution.
OpenAI prévoit le lancement en janvier de l’outil d’IA Operator
OpenAI viserait un Lancement d’Operator en janvier. Les découvertes récentes de Blaho incluent des options cachées dans le client ChatGPT d’OpenAI pour macOS qui permettent aux utilisateurs de définir des raccourcis vers « Toggle Operator » et « Forcer Quit Operator ». En outre, Blaho note qu’OpenAI a ajouté des références à Operator sur son site Web, bien que ces références ne soient pas encore visibles publiquement.
OpenAI lancera un agent d’IA autonome Operator en janvier
Selon Blaho, le site Web contient également des tableaux non publiés comparant les performances d’Operator avec d’autres systèmes d’IA utilisant un ordinateur. Si les chiffres sont exacts, ils indiquent que l’opérateur n’est pas entièrement fiable, selon la tâche. Par exemple, dans un benchmark sur OSWorld, qui simule un environnement informatique réel, « OpenAI Computer Use Agent (CUA) » a obtenu un score de 38,1 %, meilleur que le modèle d’Anthropic mais nettement inférieur au score de 72,4 % obtenu par les humains. L’OpenAI CUA surpasse les agents humains au test WebVoyager, qui évalue les compétences de navigation Web d’une IA, mais il est sous-performant sur un autre benchmark, WebArena.
L’opérateur semble avoir du mal à effectuer des tâches généralement faciles pour les humains. Lors des tests exigeant que l’opérateur s’inscrive auprès d’un fournisseur de cloud et lance une machine virtuelle, il a réussi 60 % du temps. Pendant ce temps, il n’a réussi à créer un portefeuille Bitcoin que 10 % du temps, selon la fuite. repères.
OpenAI entre dans l’espace des agents d’IA à un moment où des concurrents comme Anthropic et Google progressent également dans ce domaine. La société d’analyse Markets and Markets prévoit que le marché des agents d’IA pourrait atteindre 47,1 milliards de dollars d’ici 2030. Bien que les agents d’IA restent à un stade primitif de développement, certains experts expriment des inquiétudes quant à leur sécurité, surtout si la technologie s’améliore rapidement.
Un tableau divulgué indique que l’opérateur obtient de bons résultats dans certaines évaluations de sécurité, notamment en résistant aux tentatives de se livrer à des activités illicites et de rechercher des données personnelles sensibles. Il semblerait que les tests de sécurité aient contribué au long cycle de développement d’Operator. Wojciech Zaremba, co-fondateur d’OpenAI critiqué La récente publication de l’agent Anthropic pour manque de mesures de sécurité, indiquant une réaction potentielle si OpenAI devait accélérer une version similaire.
Des critiques ont été adressées à OpenAI par des chercheurs en IA et d’anciens employés pour avoir prétendument donné la priorité à la production rapide de la technologie plutôt qu’aux mesures de sécurité.
Crédit image : Tibor Blaho