Alibaba libéré Qwen3, une famille de modèles d’IA que l’entreprise prétend correspond et parfois surpasse les meilleurs modèles de Google et Openai, lundi. Les modèles varient en taille de 0,6 milliard de paramètres à 235 milliards de paramètres et sont disponibles en téléchargement sous une licence «ouverte» à partir de la plate-forme AI Dev Visage étreint et Github.
Les modèles QWEN3 sont décrits comme «hybrides» car ils peuvent prendre du temps pour «raisonner» à travers des problèmes complexes ou répondre rapidement aux demandes plus simples. Cette capacité de raisonnement permet aux modèles de se vérifier efficacement, similaire au modèle O3 d’OpenAI, mais avec une latence plus élevée. Selon l’équipe QWEN, ils ont «des modes de réflexion et de non-pensée intégrés de manière transparente, offrant aux utilisateurs la flexibilité pour contrôler le budget de réflexion».
Certains modèles QWEN3 adoptent un mélange d’architecture d’experts (MOE), qui peut être plus efficace sur le plan informatique pour répondre aux requêtes. Moe décompose les tâches en sous-tâches et les délégue à des modèles «experts» plus petits et spécialisés. Les modèles prennent en charge 119 langues et ont été formés sur un ensemble de données de près de 36 billions de jetons, y compris des manuels, des paires de réponses aux questions, des extraits de code et des données générées par AI-AI.

Alibaba affirme que les capacités de QWEN3 se sont considérablement améliorées par rapport à son prédécesseur, Qwen2. Le plus grand modèle QWEN3, QWEN-3-235B-A22B, fonctionne de manière compétitive sur les évaluations de référence, battant O3-Mini d’Openai et Gemini 2.5 Pro de Google sur lesforces de code, une plate-forme pour les concours de programmation. Il surpasse également O3-MinI sur la dernière version de l’AIME, une référence mathématique difficile, et BFCL, un test pour évaluer la capacité d’un modèle à raisonner sur les problèmes.

Bien que QWEN-3-235B-A22B ne soit pas accessible au public, le plus grand modèle public QWEN3, QWEN3-32B, est toujours compétitif avec plusieurs modèles d’IA propriétaires et ouverts. QWEN3-32B dépasse le modèle O1 d’OpenAI sur plusieurs tests, y compris le codage LivecodeBench. Alibaba dit que Qwen3 excelle dans les capacités d’appel à outils, les instructions suivantes et la copie de formats de données spécifiques.
Tuhin Srivastava, co-fondateur et PDG d’Ai Cloud Host Baseten, a noté que Qwen3 est un autre exemple de modèles ouverts en suivant le rythme des systèmes de source fermée comme Openai. Il a ajouté que des modèles comme Qwen3 seront probablement utilisés au niveau national, malgré les restrictions américaines sur les ventes de puces à la Chine.
Qwen3 est disponible en téléchargement et via des fournisseurs de cloud, y compris des feux d’artifice AI et hyperboliques.