xAI, propriété d’Elon Musk, a commencé à déployer Grok 4.1, une mise à niveau du modèle Grok 4. La version améliore la qualité et la vitesse, avec un accès gratuit pour tous les utilisateurs afin d’améliorer les performances des grands modèles de langage. xAI a lancé deux versions du nouveau modèle : Grok 4.1 et Grok 4.1 Thinking. Les deux intègrent des améliorations progressives par rapport aux itérations précédentes. Les utilisateurs gratuits peuvent accéder immédiatement à ces modèles, tandis que les clients payants bénéficient de limites d’utilisation réduites. xAI déclare que Grok 4.1 réduit les taux d’hallucinations d’un facteur trois par rapport aux modèles précédents. Cette avancée positionne cette version parmi les offres les plus performantes de xAI à ce jour. Les hallucinations, où les modèles génèrent des informations inexactes, représentent un défi majeur dans le développement de grands modèles de langage, et cette réduction découle d’améliorations ciblées de la formation. Les performances par rapport à des concurrents comme GPT 5.1, lancé récemment avec des gains en termes de performances et d’intelligence émotionnelle, ne sont pas confirmées par des comparaisons directes. Les mises à jour de GPT 5.1 se concentrent sur l’amélioration de la précision des réponses et de la compréhension contextuelle des interactions. Text Arena de LMArena fournit les premières données de performances sur Grok 4.1. Cet outil open source permet des comparaisons côte à côte, aveugles et aléatoires de grands modèles linguistiques. Les utilisateurs soumettent des invites et la plateforme associe les réponses de manière anonyme pour classer les modèles en fonction des préférences humaines. Les premiers benchmarks de Text Arena placent Grok 4.1 (pensée) au premier rang du classement Arena Expert avec un score de 1510. Grok 4.1 se classe au 19e rang avec un score de 1437. Ces résultats montrent que les deux modèles atteignent de nouvelles positions dans l’environnement compétitif de Text Arena. La plateforme de référence a observé : « Il s’agit d’une amélioration de plus de 40 points depuis Grok 4 fast, qui a atterri dans l’arène à peine deux mois auparavant. » Grok 4 est rapidement entré dans le classement en septembre 2025, établissant une référence que Grok 4.1 dépasse désormais considérablement. https://twitter.com/arena/status/1990530978943787291





