Disponible sur Amazon Bedrock, la gamme Amazon Nova comprend Nova Micro, un modèle texte-texte très efficace, Nova Lite, Nova Pro et Nova Premier, des modèles multimodaux qui traitent du texte, des images et des vidéos pour générer du contenu textuel.
Amazon a également dévoilé deux modèles supplémentaires : Toile Amazon Novaconçu pour produire des visuels de qualité studio, et Bobine Amazon Novaqui génère des vidéos de qualité professionnelle.
Rohit Prasad, vice-président principal d’Amazon Artificial General Intelligence, a souligné le point de vue unique d’Amazon en déclarant :
« Chez Amazon, nous utilisons près de 1 000 applications d’IA. Cela nous donne une compréhension approfondie des domaines dans lesquels les développeurs continuent de faire face à des défis. Nos nouveaux modèles Amazon Nova visent à aider les développeurs internes et externes à Amazon à surmonter ces obstacles. Ils offrent des capacités exceptionnelles d’intelligence et de génération de contenu tout en améliorant la latence, la rentabilité, la personnalisation, la génération augmentée par récupération (RAG) et les fonctionnalités basées sur des agents.
Amazon Nova : Intelligence et rapidité en action
La gamme Nova comprend quatre modèles : Amazon Nova Micro avec une latence et un coût ultra faibles, ce qui le rend idéal pour les applications texte uniquement nécessitant des réponses rapides. Les trois modèles restants repoussent les limites de l’IA multimodale :
- Amazon Nova Lite est une option rentable pour traiter des images, des vidéos et du texte à des vitesses remarquables.
- Amazon Nova Pro combine précision, rapidité et rentabilité pour un large éventail de tâches, offrant des fonctionnalités avancées dans de multiples modalités.
- Amazon Nova Premier se présente comme le modèle multimodal le plus puissant d’Amazon, excellant dans les tâches de raisonnement complexes et servant de « professeur » idéal pour distiller des modèles plus petits et spécialisés.
Amazon Nova Micro, Nova Lite et Nova Pro sont déjà disponibles pour un usage général, tandis que Nova Premier sera lancé au premier trimestre 2025.
Résultats des tests de performance
Les modèles Nova ont été rigoureusement testés par rapport aux normes de référence de l’industrie. Les résultats montrent que ces modèles fonctionnent systématiquement à égalité ou dépassent les principales alternatives.
- Amazon Nova Micro obtenu des résultats compétitifs, équivalents ou surperformants Méta LLaMa 3.1 8B sur 11 benchmarks et Google Gemini 1.5 Flash-8B sur 12 benchmarks. Avec une vitesse de sortie de pointe de 210 jetons par seconde, il est idéal pour les applications nécessitant des réponses rapides.
- Amazon Nova Lite a démontré de solides performances dans tous les tests de référence, y compris la précision des tâches de texte et la compréhension des vidéos, des graphiques et des documents, excellant dans les tests TVAX, ChartQA et DocVQA.
- Amazon Nova Pro a présenté ses capacités en surpassant OpenAI GPT-4o dans 17 tests sur 20 et en fournissant des résultats exceptionnels pour les flux de travail RAG, le suivi des instructions et les tâches basées sur des agents.
Prise en charge de tâches contextuelles longues, multilingues et multimodales
Les modèles Amazon Nova Micro, Lite et Pro prennent en charge plus de 200 langues. Nova Micro gère des contextes d’entrée jusqu’à 128 000 jetons, tandis que Nova Lite et Nova Pro prennent en charge jusqu’à 300 000 jetons ou un traitement vidéo de 30 minutes. Amazon prévoit d’étendre ce chiffre à plus de 2 millions de jetons début 2025.
Performances économiques et rapides
Les modèles Amazon Nova sont conçus pour offrir une vitesse et une rentabilité exceptionnelles. Par rapport aux autres modèles les plus performants de leurs classes d’intelligence sur Amazon Bedrock, Nova Micro, Nova Lite et Nova Pro sont au moins 75 % plus rentable tout en offrant les performances les plus rapides.
Intégration transparente avec Amazon Bedrock
Les modèles Amazon Nova s’intègrent directement à Amazon Bedrock, le service entièrement géré d’AWS qui permet aux clients d’accéder aux modèles de base des principaux fournisseurs d’IA et d’Amazon lui-même via un seul appel API. Avec Bedrock, les développeurs peuvent facilement tester et évaluer les modèles Nova ainsi que d’autres options pour déterminer la meilleure solution pour leurs applications.
La personnalisation par la mise au point
Les modèles Amazon Nova prennent en charge un réglage personnalisé, permettant aux clients d’améliorer la précision en guidant les modèles avec des exemples tirés de leurs propres données. Les modèles apprennent ce qui compte le plus pour un client (qu’il s’agisse de texte, d’images ou de vidéos) et Amazon Bedrock fournit ensuite des réponses personnalisées et affinées.
Distillation efficace pour les modèles plus petits et spécialisés
En plus du réglage fin, Nova prend en charge modèle de distillationpermettant le transfert de connaissances de grands modèles à haute capacité vers des modèles plus petits, plus rapides et plus rentables sans sacrifier la précision.
Améliorer la précision grâce à la génération augmentée par récupération
Les modèles Amazon Nova s’intègrent parfaitement à Bases de connaissances sur le substrat rocheux d’Amazonpermettant à la génération augmentée par récupération (RAG) de fournir des réponses basées sur les propres données d’une organisation pour les plus hauts niveaux de précision.
Optimisé pour les applications d’agent
Conçus pour exceller dans les tâches en plusieurs étapes, les modèles Nova sont optimisés pour les applications basées sur des agents nécessitant une interaction avec des systèmes et des données propriétaires via plusieurs API.
Contenu visuel de qualité production
Toile Amazon Nova génère des images de qualité professionnelle à partir d’invites de texte ou d’image, avec des commandes intégrées pour l’édition, les ajustements de couleurs et les mises en page. Les protections intégrées incluent le filigrane et la modération du contenu pour garantir une utilisation responsable de l’IA. Lors des évaluations, Nova Canvas a surpassé des modèles comme OpenAI DALL·E 3 et Stable Diffusion.
Bobine Amazon Nova permet aux clients de créer des vidéos de haute qualité à partir de texte et d’images. Conçu pour le contenu publicitaire, marketing et éducatif, il permet de contrôler les styles visuels, le rythme et les effets de caméra. Nova Reel a constamment surpassé ses concurrents, les critiques préférant sa sortie à Runway Gen-3 Alpha. Tout en prenant actuellement en charge les vidéos de six secondes, Nova Reel s’étendra à la génération de vidéos de deux minutes dans les mois à venir.
Regard vers l’avenir : modèles vocaux et multimodaux à multimodaux
Au premier trimestre 2025, Amazon prévoit de publier un modèle parole-parole conçu pour transformer les applications d’IA pour des interactions vocales naturelles. Le modèle interprétera la langue parlée, le ton et le tempo pour fournir des réponses de type humain avec une latence minimale.
De plus, Amazon développe un modèle multimodal à multimodal capable de prendre du texte, des images, de l’audio et de la vidéo comme entrées et de produire des sorties selon l’une de ces modalités. Ce modèle, prévu pour mi-2025, simplifiera les applications nécessitant la traduction, l’édition et la compréhension multimodale de contenu.
Adoption anticipée
Plusieurs organisations de premier plan adoptent déjà les modèles Nova :
- SÈVE intègre les modèles Nova dans SAP AI Core pour alimenter des solutions basées sur l’IA en matière d’automatisation, de personnalisation et de planification de la chaîne d’approvisionnement.
- Deloitte exploite les capacités de personnalisation avancées de Nova pour fournir des services d’IA générative sur mesure à l’échelle mondiale.
- Dentsu Digital Inc. utilise Nova Reel pour rationaliser la production vidéo créative, réduisant ainsi les délais de campagne de quelques semaines à quelques jours.
- Match de musique intègre Nova Reel à sa plateforme pour aider les artistes émergents à générer des vidéoclips de haute qualité.
- 123RF simplifie les processus de conception pour les créateurs de contenu avec Nova Canvas et Nova Reel.
- Caylent utilise les modèles Nova pour accélérer les flux de travail de compréhension vidéo pour les clients des médias, du sport et de la vente au détail.
- Palantir Technologies intègre Nova Pro à son système d’ontologie pour améliorer les flux de prise de décision basés sur l’IA dans tous les secteurs.
- Shutterstock intègre Nova Canvas dans son générateur d’images AI pour offrir une solution intuitive pour la création de contenu visuel de haute qualité.
AWS a publié des informations détaillées Cartes de service IA pour les modèles Nova, assurant la transparence sur les cas d’utilisation, les limitations et les pratiques responsables en matière d’IA :