Stability AI a dévoilé un générateur de musique IA révolutionnaire, Stable Audio, le 13 septembre 2023. Alors que la sphère de la génération musicale IA est peut-être déjà familière avec OpenAI Juke-boxStability AI, en partenariat avec AudioSparx– vise à offrir quelque chose de nouveau et de convaincant dans ce domaine.
Ce n’est pas le premier rodéo de Stability AI dans le domaine de l’intelligence artificielle. L’année dernière, la société a lancé Dance Diffusion, une solution d’IA conçue pour créer des chansons et des effets sonores basés sur les invites fournies par l’utilisateur. Malgré son ingéniosité, Diffusion de danse a été laissé dans sa phase de prototype alors que l’équipe R&D s’est tournée pour se concentrer sur son nouveau générateur de musique.
Quant à la technologie derrière, nous pouvons confirmer que Stable Audio utilise des modèles d’IA de diffusion audio de pointe pour générer de la musique. Destiné aux applications individuelles et commerciales, ce nouvel outil cherche à redéfinir ce qui est possible dans le paysage musical généré par l’IA.
Qu’est-ce que Stable Audio : Stability AI dévoile son générateur de musique
Quelques jours seulement après son lancement, Stable Audio, le générateur de musique innovant de Stability AI, suscite déjà une attention et des éloges généralisés. Cela marque un moment charnière pour Stability AI, en particulier compte tenu de la trajectoire incomplète de leur projet précédent, Dance Diffusion.
En dévoilant Stable Audio, la société a établi une nouvelle norme en matière de musique générée par l’IA. Conçue pour produire un son original de haute qualité en stéréo 44,1 kHz, la technologie qui la sous-tend est tout simplement révolutionnaire. Comme indiqué officiellement, Stable Audio utilise « un modèle de diffusion latente pour l’audio, formé sur les données d’AudioSparx, une bibliothèque musicale de premier plan ».
Ed Newton-Rex, vice-président de l’audio pour Stability AI, s’est récemment entretenu avec TechCrunchélucidant les objectifs plus larges de l’entreprise.
« Stability AI a pour mission de libérer le potentiel de l’humanité en créant des modèles d’IA fondamentaux à travers un certain nombre de types de contenu ou de « modalités ». Nous avons commencé avec Stable Diffusion et avons grandi pour inclure les langages, le code et maintenant la musique. Nous pensons que l’avenir de l’IA générative réside dans la multimodalité.
En ce qui concerne les données utilisées pour entraîner Stable Audio, les chiffres parlent d’eux-mêmes. Avec un ensemble de formation comprenant plus de 800 000 fichiers audio (y compris de la musique, des tiges d’instrument unique, des effets sonores et des métadonnées de texte), tous fournis par AudioSparx, l’ensemble de données englobe plus de 19 500 heures d’audio.
Contrairement aux rumeurs suggérant que Stable Audio était un produit d’Harmonai, la réalité est qu’Harmonai fonctionne comme la branche de recherche musicale de Stability AI. L’équipe audio dédiée de Stability a en fait été formée en avril, s’inspirant de Dance Diffusion pour faire naître la merveille qu’est Stable Audio.
Dans son TechCrunch interview, Newton-Rex a comparé Stable Audio à son prédécesseur, Dance Diffusion :
« Dance Diffusion générait des clips audio courts et aléatoires à partir d’une palette sonore limitée, et l’utilisateur devait affiner lui-même le modèle s’il souhaitait avoir un contrôle. Stable Audio peut générer un son plus long et l’utilisateur peut guider la génération à l’aide d’une invite de texte et en définissant la durée souhaitée. Il a également affirmé : « Certaines invites fonctionnent à merveille, comme l’EDM et la musique plus rythmée, ainsi que la musique ambiante, et certaines génèrent un son un peu plus « là-bas », comme la musique plus mélodique, le classique et le jazz. »
Comment utiliser l’audio stable ?
Suivez ces étapes pour commencer en quelques minutes :
- Accédez au site Web officiel de Stable Audio pour vous assurer que vous accédez à la plate-forme en toute sécurité et que vous bénéficiez de la gamme complète de fonctionnalités.
- Localisez et cliquez sur le bouton « Essayez-le gratuitement », qui se trouve généralement dans le coin supérieur droit de la page d’accueil, pour commencer votre voyage musical avec l’IA.
- Connectez-vous avec une adresse e-mail valide ou utilisez facilement votre compte Google. Assurez-vous que les détails sont exacts pour éviter de futurs problèmes de connexion.
- Lisez et acceptez les conditions d’utilisation pour continuer. En option, vous pouvez choisir de vous abonner à la newsletter de Stable Audio pour vous tenir au courant des mises à jour, des conseils et des promotions.
- Une fois connecté, vous vous retrouverez sur le tableau de bord principal. Stable Audio propose des conseils utiles dans le volet de gauche pour vous guider sur les types d’invites que vous pouvez utiliser pour générer de la musique.
- Pour générer de la musique, entrez simplement l’invite et les caractéristiques sonores de votre choix dans le champ désigné. Par exemple, vous pouvez saisir quelque chose comme «Heavy metal, thrash, headbanging, promotion de concert, guitare déchiquetée, agressif, 180 bpm»
- Après avoir saisi votre invite, cliquez sur le bouton fléché pour lancer le processus de génération de musique. Quelques instants plus tard, vous pouvez écouter le résultat audio et évaluer s’il correspond à votre vision créative.
- Ci-dessous, vous pouvez trouver notre propre création, vous pouvez cliquer sur le bouton de lecture pour avoir une idée de ce que Stable Audio peut réaliser :
Comment saisir les invites Stable Audio comme un pro ?
Plongez dans le système d’invite de Stable Audio avec un état d’esprit expert, en adaptant chaque commande pour répondre à vos besoins créatifs. Pour maximiser votre rendement, tenez compte de ces conseils :
Précisez les détails
Que vous envisagiez un genre spécifique ou une ambiance nuancée, expliquez-le clairement. Plus votre invite est détaillée, plus le résultat sera conforme à votre vision artistique.
Dicter l’atmosphère
Stable Audio – le générateur de musique de Stability AI – vous permet d’exprimer vos préférences d’ambiance directement dans votre invite. Vous voulez quelque chose d’optimiste, d’émouvant ou peut-être méditatif ? Dites-le simplement et l’IA vous obligera.
Choisissez soigneusement vos instruments
Envie de la richesse des Swelling Strings ou du timbre des Reverberated Guitars ? Stable Audio suggère que « les adjectifs peuvent être un gros plus pour nommer des instruments ». Soyez aussi précis que possible pour guider l’IA dans la satisfaction de vos préférences musicales.
Calibrer le tempo
Faites attention aux battements par minute (BPM) lorsque vous souhaitez contrôler à la fois le rythme et le genre de votre musique. Cela garantit que votre pièce générée ne reflète pas seulement vos goûts, mais répond également à vos exigences de temps.
Kits.ai veut être une boîte à outils tout-en-un pour dynamiser votre musique
Tarification de l’audio stable
Stable Audio propose une version gratuite pour les créateurs en herbe. Bien que la version gratuite limite la portée de votre production musicale, elle constitue une excellente passerelle pour explorer les capacités de ce générateur de musique révolutionnaire.
Niveau de tarification | Coût | Générations de suivi mensuelles | Durée de la piste | Licence |
Gratuit | C’est gratuit. Commencer! | 20 | Jusqu’à 45 secondes | Usage non commercial |
Professionnel | 11,99 $ par mois | 500 | Jusqu’à 90 secondes | Un usage commercial |
Entreprise | Montant personnalisé | Coutume | Coutume | Un usage commercial |
Si l’essai vous donne envie de plus, envisagez de passer au niveau « Professionnel ». Au prix raisonnable de 11,99 $ par mois, ce forfait vous offre la liberté de produire 500 générations de pistes mensuelles, chacune d’une durée maximale de 90 secondes. Comme avantage supplémentaire, une licence d’utilisation commerciale est intégrée, ce qui la rend idéale pour les petites et moyennes entreprises.
Pour les grandes organisations recherchant une expérience plus personnalisée, Stable Audio présente son package « Entreprise ». Offre personnalisée adaptée aux besoins organisationnels, elle permet aux entreprises d’exploiter pleinement les capacités de la technologie à grande échelle.
En proposant ces diverses options de tarification, Stable Audio permet à un large public, des novices aux professionnels chevronnés, d’interagir avec la plateforme. Cette stratégie de tarification flexible démocratise non seulement l’accès à de la musique générée par l’IA de haute qualité, mais permet également aux utilisateurs de sélectionner le forfait qui correspond le mieux à leurs besoins créatifs et à leurs contraintes budgétaires.
Crédit image en vedette : Kerem Gülen/Milieu du voyage