Openai a annoncé la sortie de Sora 2, son modèle phare de génération vidéo et de génération audio. Le nouveau modèle, qui présente une précision physique améliorée, un plus grand contrôle des utilisateurs et la possibilité d’insérer des éléments du monde réel en scènes générées, est déployé via une nouvelle application sociale pour iOS appelée « Sora ». Cette version marque un pas en avant significatif par rapport au modèle SORA original lancé en février 2024. OpenAI décrit cette progression comme un « moment GPT-3.5 pour la vidéo potentiel », indiquant un saut substantiel de capacité et de performance.
Améliorations clés de Sora 2
Sora 2 introduit plusieurs progrès majeurs par rapport à son prédécesseur, se rapprochant de l’objectif de créer un simulateur mondial fonctionnel.
- Précision physique améliorée: Les modèles vidéo précédents étaient souvent «trop optimistes», sans tenir compte de la physique réaliste pour réaliser l’invite d’un utilisateur. Sora 2 montre une simulation plus ancrée des lois physiques, modélisant avec précision les résultats comme un tir de basket manqué rebondissant sur le panneau plutôt que de se téléporter dans le cerceau.
- Contrôlabilité avancée de l’utilisateur: Le modèle peut suivre des instructions complexes et multiples tout en maintenant l’état du monde généré à travers différentes scènes et angles de caméra, permettant des récits vidéo plus complexes et cohérents. Il montre également la maîtrise de divers styles esthétiques, notamment réaliste, cinématographique et anime.
- Intégration des éléments du monde réel: Les utilisateurs peuvent désormais injecter des éléments du monde réel dans des environnements générés. En enregistrant une vidéo d’une personne, d’un animal ou d’un objet, le modèle peut placer cet élément dans n’importe quelle scène générée par Sora, dépeignant avec précision son apparence et sa voix.
L’application sociale Sora et les camées
OpenAI déploie le nouveau modèle via une application iOS sociale conçue pour créer et partager du contenu vidéo. La caractéristique centrale de l’application est «camées», qui opérationnalise la capacité du modèle à insérer des éléments du monde réel. Pour créer un camée, un utilisateur enregistre un court clip vidéo et audio au sein de l’application, qui capture sa ressemblance et sa voix pour une utilisation en générations. Les utilisateurs ont un contrôle complet sur leur ressemblance personnelle et peuvent décider qui est autorisé à utiliser leur camée. Ils peuvent également révoquer l’accès ou supprimer toute vidéo qui comprend leur camée à tout moment.
Concentrez-vous sur le bien-être et la sécurité des utilisateurs
Lors du lancement de l’application, OpenAI a décrit des mesures pour répondre aux préoccupations telles que la dépendance numérique et l’isolement social.
- Feed Philosophy: L’algorithme de flux de l’application est conçu pour « maximiser la création, pas la consommation », la priorisation du contenu des personnes que l’utilisateur suit et le contenu susceptible d’inspirer leur propre travail créatif. OpenAI déclare qu’il « n’optimisait pas le temps passé en flux ».
- Sécurité des adolescents: Des garanties spécifiques pour les utilisateurs adolescents incluent des limites quotidiennes par défaut sur le nombre de générations qu’ils peuvent afficher et des autorisations plus strictes concernant l’utilisation de leurs camées. OpenAI lance également des contrôles parentaux via ChatGpt pour gérer les paramètres des comptes des adolescents.
- Modération: En plus des systèmes de sécurité automatisés, la société augmente ses équipes de modérateurs humains pour examiner les cas potentiels d’intimidation.
Disponibilité et accès
L’application Sora iOS est maintenant disponible en téléchargement aux États-Unis et au Canada, avec des plans pour s’étendre à d’autres pays. L’accès est en cours de déploiement sur un système basé sur l’invitation pour encourager les utilisateurs à se joindre à leurs amis.
- Prix: Le service sera initialement gratuit, avec des «limites généreuses à démarrer». OpenAI a déclaré que son seul plan de monétisation actuel est de permettre aux utilisateurs de payer pour des générations supplémentaires si la demande dépasse les ressources informatiques disponibles.
- Sora 2 Pro: Les abonnés à Chatgpt Pro auront accès à une version expérimentale de meilleure qualité du modèle appelé Sora 2 Pro, qui sera disponible sur le site Web Sora.com.
- Accès à l’API: OpenAI prévoit de libérer Sora 2 via son API pour les développeurs. Le modèle précédent, Sora 1 Turbo, restera disponible.
OpenAI considère l’amélioration rapide des modèles vidéo comme une étape cruciale vers le développement de simulateurs mondiaux à usage général et d’agents robotiques, présentant Sora 2 comme « un progrès significatif vers cet objectif ».





