Le dernier projet de Google, nommé « Projet Jarvis », devrait exploiter l’IA pour automatiser les tâches Web dans le navigateur Chrome.
Selon Les informationsce projet basé sur l’IA, qui devrait faire ses débuts en avant-première en décembre, est motivé par Gémeaux 2.0 de Google modèle et représente un outil destiné au consommateur visant à simplifier les interactions en ligne. Inspiré de l’assistant fictif JARVIS de Marvel, Jarvis effectuera de manière autonome des tâches numériques en plusieurs étapes, allant des achats en ligne à la réservation de voyages.
Gemini 2.0 alimente le projet Jarvis
Gemini 2.0, la dernière itération du modèle d’IA avancé de Google, sert de base au projet Jarvis. Dévoilé à Google E/S 2024Gemini est conçu avec des améliorations en matière de raisonnement, de planification et de mémoire, toutes visant à aider les utilisateurs à accomplir des tâches complexes en plusieurs étapes de manière autonome.
Comme l’a expliqué Sundar Pichai, PDG de Google lors d’I/O, l’objectif est de créer « des systèmes intelligents qui montrent le raisonnement, la planification et la mémoire, [and are] capable d’anticiper plusieurs étapes » tout en restant entièrement supervisé par l’utilisateur. Avec ces capacités, Gemini vise à fournir un «exemple phare» sur la manière dont les futurs agents d’IA peuvent améliorer la productivité et réduire les interventions des utilisateurs.
Ce qui distingue Jarvis, c’est sa capacité à opérer au sein du Chrome navigateur, capturer des captures d’écran pour guider ses interactions avec les formulaires et boutons en ligne. Selon The Information, Jarvis prend fréquemment des captures d’écran de la fenêtre Chrome d’un utilisateur pour interpréter chaque interface, lui permettant de « cliquer » sur des boutons, de saisir des champs ou même de comparer des éléments sur des sites Web.
La méthode basée sur les captures d’écran permet également à Jarvis de comprendre les formes complexes et des mises en page qui varient considérablement selon les différents sites. Cependant, cette fonctionnalité signifie que Jarvis fonctionne relativement lentement, prenant quelques secondes pour analyser chaque capture d’écran avant de passer à l’étape suivante. Bien qu’elle ne soit pas encore optimisée pour la vitesse, cette technologie illustre la stratégie de Google consistant à utiliser des ressources basées sur le cloud pour prendre en charge des tâches d’IA complexes qui nécessiteraient autrement une puissance de traitement sur l’appareil.
Et les candidatures ?
Le projet Jarvis promet de changer la façon dont les utilisateurs interagissent avec les plateformes numériques, en mettant l’accent sur l’automatisation des tâches Web de routine telles que l’achat de produits, la réservation de vols ou la collecte de recherches.
Cette fonctionnalité pourrait plaire à un large public, des professionnels très occupés aux utilisateurs quotidiens cherchant à rationaliser leurs tâches. Le rapport d’information souligne que Jarvis permettra aux utilisateurs d’effectuer des processus Web étendus avec une contribution minimaleleur permettant de déléguer des activités chronophages à l’IA. Ce faisant, Google vise à positionner Jarvis comme un outil orienté vers le consommateur et axé sur la productivité, un peu comme La vision copilote de Microsoft ou celui d’Apple Apple Intelligence.
Quand les utilisateurs peuvent-ils accéder à Google Jarvis ?
Les rapports suggèrent qu’un premier aperçu du projet Jarvis pourrait faire ses débuts en décembremême si les détails pourraient changer. La société publiera probablement l’outil à un public limité dans un premier temps pour identifier et résoudre les bogues ou limitations avant un déploiement plus large.
Google a utilisé une approche similaire pour les lancements de produits antérieurs, comme son IA du bardedonnant aux premiers utilisateurs la possibilité de faire part de leurs commentaires et de contribuer aux améliorations avant une disponibilité plus large. Cette phase de test pourrait façonner la manière dont Google optimise Jarvis pour des performances plus rapides et plus transparentes tout en garantissant que les protocoles de sécurité répondent aux attentes des utilisateurs.
Voilà les inquiétudes
En tant qu’assistant IA disposant d’un contrôle important sur l’expérience Web d’un utilisateur, Jarvis soulève de nouvelles préoccupations en matière de confidentialité et de sécurité. Étant donné que Jarvis s’appuie sur l’interprétation de captures d’écran d’informations potentiellement sensibles, des mesures de sécurité robustes seront essentielles pour garantir la protection des données des utilisateurs. Le plan de Google comprend des tests approfondis de ces protections avant que Jarvis ne voie une version plus large, mais les risques potentiels associés à un niveau d’accès au système aussi élevé suscitent un débat parmi les défenseurs de la vie privée et les développeurs.
En accordant à des outils d’IA comme Jarvis un contrôle direct sur les appareils des utilisateurs, Google doit mettre en œuvre des mesures de protection pour empêcher les vulnérabilités et les accès non autorisés. Bien que le projet Jarvis soit encore en développement, il promet de changer la donne en matière de productivité basée sur l’IA en permettant aux utilisateurs de déléguer des tâches complexes en plusieurs étapes dans le navigateur Chrome. En combinant la puissance de Gemini 2.0 avec les capacités Web de Chrome, Google crée une IA qui pourrait redéfinir la façon dont nous abordons les tâches numériques, du shopping à la recherche.
Alors que Google finalise Jarvis pour une utilisation grand public, son succès pourrait ouvrir la voie à des expériences d’IA plus avancées et plus autonomes, modifiant ainsi la façon dont nous interagissons avec les navigateurs et, potentiellement, avec la technologie en général.
Crédits images: Emre Cıtak/Idéogramme IA