Le fabricant du modèle sophistiqué de génération d’images Stable Diffusion, Stability AI, propose désormais un tout nouvel élément appelé Stable Doodle. Ce convertisseur d’esquisse en image à la pointe de la technologie analyse les contours d’une esquisse et produit une interprétation artistique visuellement attrayante en utilisant le modèle de diffusion stable le plus récent.
En utilisant uniquement des capacités de dessin rudimentaires et un accès à Internet, n’importe qui peut créer rapidement et facilement des dessins originaux de haute qualité à l’aide de Stable Doodle. Il donne aux utilisateurs plus de contrôle sur le processus de génération d’images que d’autres solutions d’IA d’esquisse à image, ce qui facilite la création d’illustrations de haute qualité.
Bien qu’il existe d’autres générateurs d’images AI avec des capacités « image à image » que Stable Diffusion, Stable Doodle simplifie considérablement la fourniture d’une image source au modèle. Selon l’entreprise, Tencent, un acteur majeur de la technologie chinoise, lui a accordé une licence pour utiliser certaines parties de sa technologie pour aider les modèles à comprendre non seulement les croquis, mais également les poses clés et les cartes de segmentation, qui sont toutes deux importantes pour l’animation.
Dans son article de blog dévoilant la fonctionnalité, l’entreprise affirme que le nouvel outil d’IA peut accepter des croquis de différents niveaux d’informations et fournit des échantillons générés à partir de croquis, y compris un plan de design d’intérieur détaillé pour un salon et une représentation en forme de goutte d’une chaise. .
Stability AI est de retour avec Stable Doodle
Stability AI présente Stable Doodle, une application d’esquisse en image qui transforme un dessin simple en une image dynamique, offrant à une variété d’experts et d’amateurs des possibilités d’imagerie infinies.
Un dessin peut désormais prendre vie plus facilement qu’auparavant. Cette toute nouvelle application a le potentiel d’améliorer considérablement une variété de secteurs, y compris l’éducation, la conception créative, la mode et les arts. Sur le site Web, Stable Doodle et la version la plus récente du modèle de diffusion stable SDXL 0.9 sont tous deux gratuits à essayer.
SDXL 0.9 est là pour changer la donne
« Stable Doodle s’adresse à la fois aux professionnels et aux novices, quelle que soit leur familiarité avec les outils d’IA. Avec Stable Doodle, toute personne possédant des compétences de base en dessin et un accès en ligne peut générer des images originales de haute qualité en quelques secondes », explique Stability AI.
Les concepteurs, illustrateurs et autres experts peuvent gagner du temps et travailler plus efficacement grâce à la simplicité de cette approche. Les idées esquissées peuvent être rapidement transformées en conceptions pour les clients, en contenu pour les sites Web et les présentations, ou même en création de logo. C’est vraiment agréable et a un potentiel illimité.
Disponibilité
Le site Web et l’application mobile Clipdrop by Stability AI (disponibles sur iOS et Google Play) proposent tous deux Stable Doodle. Sous réserve de restrictions quotidiennes, les utilisateurs peuvent commencer à explorer l’outil sans se connecter. Les utilisateurs dessinent un dessin simple avec une souris, sélectionnent une forme d’art, puis cliquent sur « générer » pour utiliser l’interface conviviale. C’est si facile.
Utiliser ControlNet Stable Diffusion, c’est comme jouer à Dieu avec la génération d’images AI
Une personnalisation encore plus créative est possible avec Stable Doodle, qui propose 14 styles différents via Stable Diffusion XL. L’étendue des styles comprend réaliste (photographie), cinématographique et inventif (origami et art fantastique).
Limites
Malgré le fait que Stable Doodle présente des capacités exceptionnelles, il est crucial de comprendre ses limites inhérentes. Il analyse le contour d’une image à l’aide d’algorithmes pour fournir un résultat à la fois esthétique et cohérent. Le produit final dépend de la conception et de la description initiales fournies par l’utilisateur, et la précision de l’outil peut varier en fonction de la complexité du scénario.
Lors de l’utilisation du nouvel outil d’IA exclusivement pour des applications cruciales, les utilisateurs doivent procéder avec prudence. Les utilisateurs du nouvel outil doivent respecter les Conditions Générales Clipdrop comme ils le font avec tous les autres outils Clipdrop.
Spécifications techniques
Stable Doodle combine le puissant adaptateur T2I avec la technologie de génération d’images de pointe de Stable Diffusion XL. Le programme de contrôle des conditions T2I-Adapter a été créé par Tencent ARC (licence). Il permet un contrôle précis de la création d’images AI.
L’adaptateur T2I permet l’intégration de nouvelles conditions d’entrée, telles que des croquis, des cartes de segmentation ou des poses clés, en introduisant des paramètres entraînables dans des modèles de grande diffusion préexistants.
Ce cadre offre un contrôle amélioré sur le processus de génération en prenant en charge simultanément de nombreux modèles pour le guidage des entrées. Pour aider le modèle texte-image pré-formé (SDXL) à comprendre les contours des croquis et à produire des images basées sur les invites et les contours définis du modèle, l’adaptateur T2I offre une assistance supplémentaire pour le cas d’utilisation Stable Doodle.
Dans le réseau T2I-Adapter, il y a environ 77 millions de paramètres. Tout en préservant l’intégrité des grands modèles texte-image d’origine, il fournit des conseils supplémentaires aux modèles texte-image pré-formés (SDXL).
Crédit image en vedette : IA de stabilité