OpenAI libéré GPT Image 1.5, une nouvelle version de ChatGPT Images, sera disponible mardi à tous les utilisateurs de ChatGPT et via l’API, offrant un suivi amélioré des instructions, une édition précise et des vitesses de génération quatre fois plus rapides pour contrer les avancées de l’IA de Google suite à la fuite du mémo « code rouge » du PDG Sam Altman. GPT Image 1.5 s’appuie sur le modèle d’image précédent de l’entreprise, GPT Image 1, lancé en avril. Cette mise à jour arrive alors que les générateurs d’images et de vidéos passent des prototypes aux outils prêts pour la production, capables de gérer des applications complexes et réelles. Le modèle introduit des fonctionnalités de post-production qui permettent un contrôle granulaire des modifications, préservant ainsi la cohérence visuelle dans des domaines tels que la ressemblance du visage, l’éclairage, la composition et la tonalité des couleurs. Ces capacités s’alignent directement sur celles de Nano Banana Pro de Google, la dernière itération de son générateur d’images qui a retenu l’attention. Cette publication fait suite aux pressions concurrentielles décrites dans la note interne d’Altman divulguée le mois dernier. Dans ce document, il déclare un « code rouge » et précise les stratégies d’OpenAI pour reprendre le leadership dans l’IA après que Google ait conquis des parts de marché. Le Gemini 3 de Google, son modèle phare, et le Nano Banana Pro se sont tous deux hissés au sommet du classement LMArena selon divers critères, surpassant les précédents favoris. OpenAI a accéléré son calendrier pour ce générateur d’images, initialement prévu pour début janvier, afin de répondre de manière plus urgente. Google conserve sa position de leader même après le lancement par OpenAI de GPT-5.2 la semaine dernière. OpenAI a présenté GPT-5.2 comme son modèle le plus avancé à ce jour, adapté aux développeurs et aux professionnels de tous les jours. Malgré cet effort, les modèles de Google continuent de dominer les indicateurs de performances clés sur des plateformes comme LMArena. Les démonstrations de GPT Image 1.5 mettent en évidence son suivi amélioré des instructions. Les utilisateurs peuvent demander des modifications ciblées, telles que « ajuster l’expression du visage » ou « rendre l’éclairage plus froid », et le modèle applique ces modifications sans réinterpréter ni altérer l’ensemble de l’image. Cette précision répond à une limitation courante des outils d’image générative d’IA, où les modifications itératives entraînent souvent des résultats incohérents qui s’écartent de l’intention initiale. https://cdn.openai.com/ctf-cdn/4o_imagegen_hero.mp4
Vidéo : OpenAI
L’accès au nouveau générateur s’effectue via un point d’entrée dédié dans la barre latérale ChatGPT. Fidji Simo, PDG des applications d’OpenAI, a décrit cette interface dans un article de blog mardi comme fonctionnant « plus comme un studio de création ». Elle a déclaré : « Les nouveaux écrans de visualisation et d’édition d’images facilitent la création d’images qui correspondent à votre vision ou vous inspirent des invites de tendances et des filtres prédéfinis. » OpenAI a simultanément déployé des améliorations pour intégrer davantage d’éléments visuels dans l’expérience ChatGPT. Les requêtes de recherche affichent désormais des visuels supplémentaires accompagnés de sources claires, prenant en charge des tâches pratiques telles que la conversion de mesures ou la vérification des résultats sportifs. Simo a expliqué le raisonnement : « Lorsque vous créez, vous devriez être capable de voir et de façonner ce que vous créez. Lorsque les visuels racontent une histoire mieux que les mots seuls, ChatGPT devrait les inclure. » Elle a ajouté : « Lorsque vous avez besoin d’une réponse rapide ou que l’étape suivante se trouve dans un autre outil, elle devrait être là. Ce faisant, nous pouvons continuer à réduire la distance entre ce que vous avez en tête et votre capacité à lui donner vie. »





