Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Qwen3 montre que les modèles ouverts peuvent toujours rivaliser avec les géants fermés

byKerem Gülen
avril 29, 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Alibaba libéré Qwen3, une famille de modèles d’IA que l’entreprise prétend correspond et parfois surpasse les meilleurs modèles de Google et Openai, lundi. Les modèles varient en taille de 0,6 milliard de paramètres à 235 milliards de paramètres et sont disponibles en téléchargement sous une licence «ouverte» à partir de la plate-forme AI Dev Visage étreint et Github.

Les modèles QWEN3 sont décrits comme «hybrides» car ils peuvent prendre du temps pour «raisonner» à travers des problèmes complexes ou répondre rapidement aux demandes plus simples. Cette capacité de raisonnement permet aux modèles de se vérifier efficacement, similaire au modèle O3 d’OpenAI, mais avec une latence plus élevée. Selon l’équipe QWEN, ils ont «des modes de réflexion et de non-pensée intégrés de manière transparente, offrant aux utilisateurs la flexibilité pour contrôler le budget de réflexion».

Certains modèles QWEN3 adoptent un mélange d’architecture d’experts (MOE), qui peut être plus efficace sur le plan informatique pour répondre aux requêtes. Moe décompose les tâches en sous-tâches et les délégue à des modèles «experts» plus petits et spécialisés. Les modèles prennent en charge 119 langues et ont été formés sur un ensemble de données de près de 36 billions de jetons, y compris des manuels, des paires de réponses aux questions, des extraits de code et des données générées par AI-AI.

Qwen3 montre que les modèles ouverts peuvent toujours rivaliser avec les géants fermés
Benchmarks partagés par Alibaba

Alibaba affirme que les capacités de QWEN3 se sont considérablement améliorées par rapport à son prédécesseur, Qwen2. Le plus grand modèle QWEN3, QWEN-3-235B-A22B, fonctionne de manière compétitive sur les évaluations de référence, battant O3-Mini d’Openai et Gemini 2.5 Pro de Google sur lesforces de code, une plate-forme pour les concours de programmation. Il surpasse également O3-MinI sur la dernière version de l’AIME, une référence mathématique difficile, et BFCL, un test pour évaluer la capacité d’un modèle à raisonner sur les problèmes.

Qwen3 montre que les modèles ouverts peuvent toujours rivaliser avec les Giants fermés_02
Benchmarks partagés par Alibaba

Bien que QWEN-3-235B-A22B ne soit pas accessible au public, le plus grand modèle public QWEN3, QWEN3-32B, est toujours compétitif avec plusieurs modèles d’IA propriétaires et ouverts. QWEN3-32B dépasse le modèle O1 d’OpenAI sur plusieurs tests, y compris le codage LivecodeBench. Alibaba dit que Qwen3 excelle dans les capacités d’appel à outils, les instructions suivantes et la copie de formats de données spécifiques.

Tuhin Srivastava, co-fondateur et PDG d’Ai Cloud Host Baseten, a noté que Qwen3 est un autre exemple de modèles ouverts en suivant le rythme des systèmes de source fermée comme Openai. Il a ajouté que des modèles comme Qwen3 seront probablement utilisés au niveau national, malgré les restrictions américaines sur les ventes de puces à la Chine.

Qwen3 est disponible en téléchargement et via des fournisseurs de cloud, y compris des feux d’artifice AI et hyperboliques.


Crédit d’image en vedette

Tags: Alibabaqwen

Related Posts

Le Qwen Code v0.5.0 d’Alibaba transforme le terminal en un écosystème de développement complet

Le Qwen Code v0.5.0 d’Alibaba transforme le terminal en un écosystème de développement complet

décembre 26, 2025
Bethesda vise 600 heures de jeu pour Fallout 5

Bethesda vise 600 heures de jeu pour Fallout 5

décembre 26, 2025
ASUS défend le port d’alimentation mal aligné du RTX 5090 HyperX comme "conception intentionnelle"

ASUS défend le port d’alimentation mal aligné du RTX 5090 HyperX comme "conception intentionnelle"

décembre 26, 2025
NVIDIA open source CUDA Tile IR sur GitHub

NVIDIA open source CUDA Tile IR sur GitHub

décembre 26, 2025
Le PDG de MicroStrategy explique les fondamentaux du Bitcoin "ça ne pourrait pas être mieux"

Le PDG de MicroStrategy explique les fondamentaux du Bitcoin "ça ne pourrait pas être mieux"

décembre 26, 2025
ChatGPT évolue vers une suite bureautique avec de nouveaux blocs de formatage

ChatGPT évolue vers une suite bureautique avec de nouveaux blocs de formatage

décembre 26, 2025

Recent Posts

  • Le Qwen Code v0.5.0 d’Alibaba transforme le terminal en un écosystème de développement complet
  • Bethesda vise 600 heures de jeu pour Fallout 5
  • ASUS défend le port d’alimentation mal aligné du RTX 5090 HyperX comme "conception intentionnelle"
  • NVIDIA open source CUDA Tile IR sur GitHub
  • Le PDG de MicroStrategy explique les fondamentaux du Bitcoin "ça ne pourrait pas être mieux"

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.