Deepseek, un laboratoire d’IA chinois, a amélioré son modèle AI Proverconçu pour résoudre les preuves et les théorèmes liés aux mathématiques, avec la sortie de la version V2 sur la plate-forme de développement de l’IA Huging Face mercredi.
La dernière version semble être construite au-dessus du modèle V3 de Deepseek, qui possède 671 milliards de paramètres et utilise une architecture de mélange d’Experts (MOE). Cette architecture permet au modèle de décomposer des tâches complexes en sous-tâches et de les déléguer à des composants «experts» spécialisés.
Dans le contexte des modèles d’IA, les paramètres sont une mesure approximative des capacités de résolution de problèmes d’un modèle. En profondeur Dernier prover mis à jour en août, le décrivant comme un modèle personnalisé pour le théorème formel prouvant et le raisonnement mathématique.
La mise à niveau intervient alors que Deepseek continue d’étendre ses offres d’IA. En février, Reuters a indiqué que la société envisageait de lever des fonds extérieurs pour la première fois. Récemment, Deepseek a publié une version améliorée de son modèle V3 à usage général et devrait bientôt mettre à jour son modèle de «raisonnement» R1.