OpenAI a lancé Sora, un modèle d’IA texte-vidéo, le mettant à la disposition des utilisateurs aux États-Unis et dans de nombreux autres pays. Dévoilé en février, Sora permet aux utilisateurs de générer des vidéos à partir d’invites textuelles, d’animer des images et de remixer des vidéos. Il fonctionne selon un modèle d’abonnement à plusieurs niveaux, offrant un accès limité aux non-abonnés.
Comment utiliser OpenAI Sora maintenant ?
Sora est accessible via Sora.com pour les utilisateurs de ChatGPT, offrant différentes fonctionnalités en fonction des niveaux d’abonnement. Les abonnés à ChatGPT Plus peuvent créer jusqu’à 50 vidéos à des résolutions allant jusqu’à 720p, tandis que les abonnés ChatGPT Pro paient 200 $ par mois pour une génération vidéo illimitée, une résolution 1080p et des fonctionnalités supplémentaires telles que des téléchargements simultanés et des téléchargements sans filigrane. La disponibilité publique du produit fait suite à une semaine de suspension du service en raison d’un accès non autorisé par une porte dérobée créée par des artistes protestant contre les pratiques d’OpenAI.
OpenAI a souligné que les vidéos générées via Sora comporteront des filigranes visibles et des métadonnées C2PA pour identifier leurs origines IA. Les utilisateurs doivent confirmer que le contenu téléchargé n’inclut pas de mineurs, de contenu explicite ou de matériel protégé par le droit d’auteur. Une utilisation abusive de la plateforme pourrait entraîner des interdictions de comptes, car OpenAI vise à équilibrer l’expression créative avec des mesures contre les activités illégales.
L’événement de lancement d’OpenAI a présenté les fonctionnalités de Sora, notamment une page « explorer » où les utilisateurs peuvent visualiser des vidéos créées par d’autres et une fonctionnalité « storyboards » permettant la création de vidéos à partir d’invites séquentielles. Le service comprend également un outil de « remix » pour modifier les sorties générées par l’IA et mélanger les visuels. Cependant, OpenAI a reconnu que les capacités de Sora ne sont pas parfaites, citant les premières réponses des testeurs comme variant entre impressionnantes et affichant « d’étranges défauts visuels ».
Bien qu’il offre des performances plus rapides dans la version Turbo par rapport à son aperçu de février, Sora a du mal avec une physique réaliste et des actions complexes sur des durées prolongées. OpenAI reconnaît ces contraintes mais souligne son intention de donner à la société le temps d’explorer les possibilités de la technologie et de co-créer des normes pour une utilisation responsable à mesure que les capacités de génération vidéo progressent.
Vidéo : OpenAI
La transparence et la sécurité restent au cœur du déploiement de Sora. Chaque vidéo générée par Sora comprend des métadonnées C2PA pour vérifier son origine, ainsi que des filigranes visibles pour distinguer le contenu de l’IA. OpenAI a également mis en œuvre des mesures de protection avancées pour bloquer les utilisations malveillantes, notamment les contenus tels que les contenus pédopornographiques (CSAM) et les deepfakes sexuels. Pour l’instant, la fonctionnalité permettant le téléchargement de ressemblances est réservée à un petit groupe de testeurs soumis à des politiques de modération strictes. OpenAI prévoit d’affiner ses efforts d’atténuation des deepfakes avant d’élargir davantage l’accès, en intégrant les informations de l’équipe rouge et des partenariats avec des ONG pour garantir un environnement sécurisé et digne de confiance.
YouTube exige des réponses sur les données d’entraînement de Sora
On ne sait pas encore si Sora sera disponible au Royaume-Uni ou dans d’autres régions d’Europe, car OpenAI est confronté à des problèmes de conformité liés aux lois sur le droit d’auteur et la protection des données. L’entreprise a fait l’objet d’un examen minutieux de ses pratiques, y compris des allégations de artistes alléguant une exploitation liée aux tests du modèle Sora.
En résumé, l’outil texte-vidéo d’OpenAI, Sora, offre des fonctionnalités telles que la génération de vidéos à partir d’invites de texte, l’animation d’images et le remixage de contenu généré par l’IA, rendant la création vidéo plus accessible et interactive. Cependant, ce n’est pas sans limites : Sora a du mal avec une physique réaliste, des actions complexes de longue durée et produit parfois des défauts visuels. Bien que la version Turbo offre une génération plus rapide et des résolutions plus élevées, ces imperfections mettent en évidence sa nature précoce. OpenAI a mis en place des garanties, notamment des filigranes et des métadonnées, pour garantir la transparence et prévenir les utilisations abusives, dans le but d’équilibrer la créativité et l’utilisation responsable de l’IA à mesure que la technologie évolue.
Le lancement de Sora met en évidence les préoccupations persistantes dans le domaine de la génération de vidéos IA, où les capacités évoluent rapidement mais peuvent conduire à une utilisation abusive à des fins de désinformation ou de deepfakes. OpenAI s’est engagé à limiter certaines formes de contenu, en bloquant les téléchargements incluant de la nudité ou des représentations préjudiciables.
Crédit image en vedette : OpenAI