Il existe une nouvelle façon de créer des sons IA ! Stability AI a introduit Stable Audio Open, un nouvel outil passionnant qui utilise des descriptions textuelles pour générer des clips audio. Des battements de batterie aux sons ambiants, vous pouvez désormais créer une large gamme d’éléments audio en quelques mots seulement.
Audio stable ouvert et Audio stable peut sembler similaire mais répondre à des besoins différents. Stable Audio est un service payant destiné aux professionnels qui souhaitent créer des chansons complètes et de la musique de haute qualité à des fins commerciales. Cependant, Stable Audio Open est gratuit et crée de courts clips audio à partir de descriptions textuelles, parfaits pour des projets simples. Voulez-vous en démarrer un ? Voici tout ce que vous devez savoir.
Qu’est-ce que l’ouverture audio stable ?
Stable Audio Open est un modèle d’IA générative de pointe développé par Stability AI, conçu pour produire des sons et de courts clips audio basés sur des descriptions textuelles. Cet outil innovant permet aux utilisateurs de créer divers éléments audio, allant des battements de batterie aux bruits ambiants, en saisissant simplement un texte descriptif.
Stable Audio Open 1.0 génère un son stéréo de longueur variable (jusqu’à 47 s) à 44,1 kHz à partir d’invites de texte. Carnet Jupyter
Grâce à @StabilitéAI Équipe audio stable
page: https://t.co/wvXRhx0AkK
code: https://t.co/FqMAGtH3ad
jupyter : s’il vous plaît, essayez-le … https://t.co/2MoK0Yd2MZ pic.twitter.com/bMsVEsJYlV– Camenduru (@camenduru) 5 juin 2024
La fonctionnalité principale de Stable Audio Open réside dans sa capacité à transformer des descriptions textuelles en enregistrements audio. Voici un aperçu étape par étape de son fonctionnement :
- Saisie de texte: Les utilisateurs fournissent une description textuelle du son souhaité. Par exemple, « beat rock joué dans un studio traité, session de batterie sur un kit acoustique ».
- Traitement de l’IA: Le modèle traite la saisie de texte à l’aide de techniques avancées de traitement du langage naturel (NLP) pour comprendre les attributs souhaités du son, tels que le genre, les instruments et l’environnement.
- Génération audio: À l’aide de son réseau neuronal entraîné, le modèle génère un clip audio d’une durée maximale de 47 secondes qui correspond à la description d’entrée.
Stable Audio Open a été formé sur un ensemble de données important composé d’environ 486 000 échantillons provenant de bibliothèques musicales libres de droits, en particulier FreeSound et Free Music Archive. Cette formation approfondie a permis au modèle d’apprendre un large éventail de sons et d’éléments musicaux, améliorant ainsi sa capacité à générer un son de haute qualité à partir de descriptions textuelles.
Que pouvez-vous faire avec Stable Audio Open ?
Voici un aperçu rapide :
- Création audio polyvalente: Le modèle peut créer une variété de types audio, notamment des battements de batterie, des riffs instrumentaux, des sons ambiants et des éléments de production adaptés aux projets multimédias tels que des vidéos, des films et des émissions de télévision.
- Transfert et édition de style: Les utilisateurs peuvent « éditer » des chansons existantes ou appliquer le style d’un genre à un autre. Par exemple, incorporer des éléments de smooth jazz dans un morceau de rock.
- Mise au point personnalisée: Un aspect unique de Stable Audio Open est sa nature open source, qui permet aux utilisateurs d’affiner le modèle avec leurs propres données audio personnalisées. Cela permet la personnalisation et la création de sons adaptés à des besoins ou à des styles spécifiques. Par exemple, un musicien peut saisir ses propres enregistrements pour générer de nouvelles variations.
Vous pouvez consulter les premiers exemples de Stable Audio Open ici.
Que ne pouvez-vous pas faire avec Stable Audio Open ?
Bien que Stable Audio Open offre des fonctionnalités importantes, il présente certaines limitations notables :
- Chansons et chants incomplets: Le modèle n’est pas optimisé pour créer des chansons complètes, des mélodies complexes ou des pistes vocales de haute qualité. Les utilisateurs à la recherche de ces fonctionnalités avancées sont dirigés vers le service Stable Audio premium de Stability AI.
- Usage non commercial: Les conditions d’utilisation de Stable Audio Open interdisent toute utilisation commerciale. Cela signifie qu’il est destiné à des fins personnelles, éducatives ou expérimentales plutôt qu’à des projets commerciaux.
- Biais et représentation: Les données de formation, bien que vastes, peuvent ne pas représenter de la même manière tous les styles et cultures musicaux. Cela peut entraîner des biais dans l’audio généré, en particulier pour les descriptions non anglaises ou les genres musicaux sous-représentés.
Comment utiliser Stable Audio Ouvert
Stable Audio Open est disponible sur Visage câlinune plateforme populaire pour intelligence artificielle des modèles. Une fois sur la page du modèle, vous trouverez des options pour télécharger les poids du modèle. Ces poids sont essentiels pour exécuter le modèle localement ou pour l’intégrer dans vos propres applications.
résumer
En résumé, le lancement de Stable Audio Open par Stability AI constitue un grand pas en avant pour rendre les sons générés par l’IA faciles et accessibles. Avec cet outil, vous pouvez créer toutes sortes d’audio, comme des battements de batterie et des sons ambiants, simplement en tapant des mots. Bien que Stable Audio Open et Stable Audio se ressemblent, ils sont en réalité différents. Stable Audio Open est gratuit et idéal pour les projets simples, tandis que Stable Audio, un service payant, est destiné aux professionnels qui créent des chansons complètes et de la musique de premier ordre pour les entreprises.
Alors, que vous soyez nouveau dans ce domaine ou un pro, Stable Audio Open est là pour vous aider à créer des sons sympas !
Crédit image en vedette :