DeepMind a introduit Genie 2, un modèle d’IA avancé capable de générer des mondes 3D interactifs à partir de simples descriptions textuelles et d’images. Annoncé le 4 décembre 2024, le successeur de Genie 1 crée divers environnements virtuels, permettant aux utilisateurs de s’engager de manière dynamique via les commandes du clavier et de la souris, simulant des actions comme sauter et nager. Il est formé sur diverses vidéos et peut modéliser les interactions, la physique et le comportement des PNJ.
DeepMind lance Genie 2, une IA révolutionnaire pour les mondes 3D
Genie 2 a la capacité de visualiser une vaste gamme de scènes 3D, offrant des fonctionnalités similaires aux jeux vidéo AAA. En traitant les invites, le modèle peut produire des environnements cohérents, y compris des perspectives à la première personne et isométriques qui durent entre 10 et 20 secondes, certaines s’étendant jusqu’à une minute. Les affirmations de DeepMind affirment que le modèle se souvient de parties d’une scène au-delà de la vue immédiate, les restituant avec précision lors de leur réapparition. Cela contraste avec les modèles existants comme le simulateur Minecraft de Decart, qui ont souvent des problèmes de cohérence et de résolution.
Ces GPU Battlemage Intel divulgués sont des bêtes de jeu
L’élément fondamental de Genie 2 implique le traitement d’une image de référence associée à une invite de texte, rationalisant ainsi la génération d’environnements hautement interactifs. Par exemple, une invite telle que « Un joli robot humanoïde dans les bois » permet au modèle de créer une scène correspondante. L’inclusion d’interactions complexes, telles que permettre aux joueurs de faire éclater des ballons ou de naviguer dans des environnements, met en valeur son moteur physique robuste. Malgré ces capacités, des inquiétudes surviennent concernant l’interprétation des entrées par le modèle, en particulier s’il reproduit par inadvertance des éléments de jeu protégés par le droit d’auteur en raison d’un manque de détails concernant les sources de données d’entraînement.
Les implications en matière de propriété intellectuelle découlant des données de formation de Genie 2 soulèvent des questions importantes. DeepMind bénéficie de l’accès étendu de Google à YouTube, utilisant éventuellement du contenu vidéo pour la formation des modèles. Cet accès conduit à des spéculations sur la génération de reproductions sans licence de jeux observés, qui pourraient faire l’objet d’un examen juridique. À mesure que le modèle d’IA brouille les limites de l’originalité, le problème de la réplication non autorisée revêt une grande importance.
Les conclusions d’un CÂBLÉ L’enquête a mis en évidence que de grandes entreprises, dont Activision Blizzard, utilisent des technologies d’IA pour rationaliser les processus, ce qui pourrait entraîner des pertes d’emplois. L’introduction de Genie 2 pourrait compliquer encore davantage le paysage, dans lequel les outils d’IA accélèrent le développement tout en remettant en question les rôles professionnels traditionnels.
DeepMind met l’accent sur le rôle de Genie 2 dans le développement de diverses tâches d’évaluation pour les agents d’IA. Même si les exigences informatiques et les perspectives de commercialisation du modèle restent confidentielles, les progrès en cours indiquent une relation évolutive entre l’IA et la conception de jeux. Divers rapports indiquent un afflux d’investissements dans les technologies modèles mondiales, ce qui signifie un changement crucial dans la recherche sur l’IA et les expériences de jeu interactif. Cette tendance résonne avec une fascination croissante pour le potentiel de l’IA à remodeler les industries créatives.
Les efforts de recrutement ciblés de DeepMind mettent en évidence l’engagement envers des développements pionniers. Leur recrutement stratégique de talents auprès d’autres grandes sociétés d’IA renforce leur intention de rester à la pointe des technologies d’IA générative.
Crédits image et vidéo en vedette : Google DeepMind