Le journaliste Evan Ratliff a récemment mené une expérience pour tester les capacités de l’intelligence artificielle dans un environnement d’entreprise en lançant une startup technologique fictive peuplée exclusivement d’agents IA. Selon un article récent dans Filaire et documenté dans la deuxième saison du podcast de Ratliff « Shell Game », le projet a été conçu pour tester la viabilité de « l’entreprise individuelle d’un milliard de dollars » prédite plus tôt cette année par le PDG d’OpenAI, Sam Altman. Ratliff a nommé l’entreprise HurumoAI et créé un site Web rempli de jargon pour le soutenir. Il était le seul décideur humain, tandis que le reste des opérations était géré par des agents de l’IA. La startup a été chargée de créer un « moteur de procrastination » appelé Sloth Surf, une application Web ironique conçue pour faire perdre du temps sur Internet au nom de l’utilisateur, le libérant ainsi théoriquement pour effectuer un travail réel. Wired rapporte que même si les employés d’IA ont immédiatement commencé à générer des plans de développement, de tests utilisateurs et de marketing, l’expérience a rapidement rencontré des problèmes. Ratliff a noté qu’une grande partie de l’activité « était entièrement inventée », ce qui l’a incité à dire au directeur de la technologie générée par l’IA de l’entreprise, Ash Roy, qu’il voulait seulement entendre parler de choses « réelles ». L’expérience a mis en évidence des limites importantes dans l’autonomie actuelle de l’IA. Dans un cas, Ratliff a suggéré en plaisantant une réunion hors site à son équipe d’IA. Les agents ont interprété cela comme un ordre direct et ont immédiatement commencé à planifier des séances de stratégie avec vue sur l’océan. Pendant que Ratliff s’éloignait pour effectuer d’autres travaux, l’équipe d’IA continuait à communiquer entre elle dans une frénésie d’activité. Cette collaboration incontrôlée a rapidement épuisé 30 $ de crédits que Ratliff avait achetés à la société d’IA Lindy.AI pour gérer les agents. Ratliff a déploré que les agents s’étaient « essentiellement parlés jusqu’à la mort ». Malgré ces contretemps, l’équipe a réussi à produire un prototype fonctionnel pour Sloth Surf après trois mois de programmation, bien que l’étendue de la contribution nécessaire de Ratliff reste floue. Wired note que cette expérience démontre que les agents d’IA ne sont pas encore prêts à remplacer massivement les travailleurs humains, un sentiment soutenu par des recherches universitaires récentes. Des chercheurs de l’Université Carnegie Mellon ont récemment libéré un article montrant que même les agents d’IA les plus performants ne parviennent pas à accomplir des tâches bureautiques réelles dans 70 % du temps.





