GPT-4o mini est le dernier modèle économique d’OpenAI que ChatGPT gratuit utilisera. Il vise à améliorer ses prédécesseurs en termes de performances et d’efficacité. De plus, des capacités de génération d’images !
Bien qu’OpenAI n’ait pas divulgué la taille exacte du modèle, GPT-4o mini est comparable à d’autres petits modèles d’IA comme Claude Haïku et Flash Gemini 1.5. Nous les comparerons dans cet article pour savoir lequel est le meilleur. Mais d’abord, comprenons ce que le GPT-4o mini offre de mieux.
Qu’est-ce que GPT-4o mini ?
GPT-4o mini est le dernier modèle d’IA d’OpenAI, conçu pour remplacer le modèle largement utilisé ChatGPT 3.5que ChatGPT gratuit utilise. Il offre des performances améliorées, des temps de réponse plus rapides et de nouvelles fonctionnalités comme la génération d’images tout en étant plus rentable. Le modèle est polyvalent et adapté à diverses applications, de la création de contenu et de la résolution de problèmes à l’analyse de données complexes et à la génération de code. Voici ses repères améliorés :
- MMLU (Compréhension massive du langage multitâche):Le modèle a obtenu un score de 82 %, ce qui reflète ses solides capacités de raisonnement sur divers sujets.
- MGSM (fusion des écoles primaires de mathématiques):Avec un score de 87%, le GPT-4o mini excelle dans le raisonnement mathématique, ce qui le rend apte à résoudre des problèmes logiques et à générer du code.
Bonne nouvelle : GPT-4o mini peut générer des images
GPT-4o mini peut traiter à la fois du texte et des images, contrairement à son prédécesseur, ChatGPT 3.5, qui se limitait au texte. Cette double capacité permet un traitement des informations plus complet et plus précis, permettant au modèle de comprendre et de générer simultanément du contenu à partir de plusieurs sources. Alors, quoi de plus ?
GPT-4o mini fournit des réponses en 10 secondes maximum, ce qui représente une amélioration significative par rapport au temps de réponse de 20 secondes de ChatGPT 3.5. Le modèle a un débit médian de 202 jetons par seconde, soit plus de deux fois plus rapide que les modèles précédents, ce qui le rend idéal pour les applications nécessitant des réponses rapides.
Le modèle peut traiter jusqu’à 128 000 jetons à la fois, soit l’équivalent de la longueur d’un livre moyen. Cette large fenêtre contextuelle garantit la cohérence et la pertinence des interactions longues ou lors du traitement de documents volumineux.
Le prix de la mini API GPT-4o est son point fort
L’un des aspects les plus remarquables du GPT-4o mini est sa rentabilité :
- Tarifs de l’API mini GPT-4o:Le modèle est vendu au prix de 15 cents par million de jetons d’entrée et de 60 cents par million de jetons de sortie. Cette structure de prix est 60 % moins chère que GPT-3.5 Turbo, ce qui rend les fonctionnalités avancées de l’IA plus accessibles à un public plus large.
Le coût réduit de fonctionnement du nouveau modèle OpenAI ouvre la voie à une adoption plus large dans divers secteurs et régions, ce qui profite particulièrement aux petites et moyennes entreprises ou aux développeurs disposant de budgets limités. Alors, GPT-4o mini est-il suffisamment puissant tout en étant rentable ?
Comparaison des modèles OpenAI : GPT-4 Turbo vs GPT-4 vs GPT-4o vs GPT-4o mini vs GPT-3.5 Turbo
Commençons d’abord par comprendre la position de GPT-4o mini dans la bibliothèque OpenAI :
Modèle | Précision (%) | MMLU | GPQA | BAISSE | MGSM | MATHÉMATIQUES | Évaluation humaine | MMMU | MathVista |
GPT-4 Turbo | 91,0 | 56,0 | 86,0 | 93,0 | 79,0 | 93,5 | 71,0 | 61,0 | 66,0 |
GPT-4 | 90,0 | 55,0 | 85,0 | 92,0 | 78,0 | 92,5 | 70,5 | 60,0 | 65,0 |
GPT-4o mini | 82,0 | 40.2 | 79,7 | 87,0 | 70.2 | 87,2 | 59,4 | 56,7 | 63,8 |
GPT-4o | 88,7 | 53,6 | 83,4 | 90,5 | 76,6 | 90,2 | 69.1 | 0,0 | 0,0 |
GPT-3.5 Turbo | 69,8 | 30,8 | 70.2 | 56.3 | 43.1 | 68,0 | 0,0 | 0,0 | 0,0 |
La comparaison des modèles d’IA révèle que GPT-4 Turbo est en tête avec les performances globales les plus élevées, avec un score de 91 % en précision, 56 % en MMLU, 93,5 % en MATH et 79 % en MGSM. GPT-4 suit de près, légèrement en retrait dans la plupart des catégories. GPT-4o mini, bien que moins puissant que GPT-4 et GPT-4 Turbo, présente toujours des capacités importantes, notamment avec une précision notable de 82 % et de solides performances dans les tâches mathématiques (MGSM 70,2 %, MATH 87,2 %). GPT-4o se distingue également par ses performances solides, excellant particulièrement dans GPQA (83,4 %) et DROP (90,5 %). En revanche, GPT-3.5 Turbo affiche des performances considérablement inférieures dans toutes les mesures, ce qui met en évidence les progrès réalisés dans les modèles ultérieurs.
GPT-4o mini contre Gemini Flash contre Claude Haiku
Il est maintenant temps de comparer le GPT-4o mini avec ses concurrents :
Modèle | Précision (%) | MMLU | GPQA | BAISSE | MGSM | MATHÉMATIQUES | Évaluation humaine | MMMU | MathVista |
Gémeaux Avancé | 87,0 | 52.0 | 82,0 | 90,0 | 74,0 | 90,0 | 67,0 | 57,0 | 62,0 |
Gémeaux | 85,0 | 50,0 | 80,0 | 88,0 | 72.0 | 88,5 | 65,0 | 55,0 | 60,0 |
GPT-4o mini | 82,0 | 40.2 | 79,7 | 87,0 | 70.2 | 87,2 | 59,4 | 56,7 | 63,8 |
Claude Haïku | 73,8 | 35,7 | 78,4 | 71,7 | 40,9 | 75,9 | 50.2 | 46.4 | 0,0 |
Flash Gémeaux | 77,9 | 38,6 | 78,4 | 75,5 | 40,9 | 71,5 | 56.1 | 58,4 | 0,0 |
Gemini Advanced et Gemini sont en tête des performances globales, Gemini Advanced obtenant le meilleur score en MMLU (52 %) et obtenant de bons résultats en GPQA (82 %), DROP (90 %) et MATH (90 %). Mais bien que le nouveau modèle OpenAI soit proche d’eux, ils ne sont pas ses concurrents naturels.
Si l’on considère Claude Haiku et Gemini Flash, leurs performances sont inférieures. Claude Haiku a particulièrement du mal avec MGSM (40,9 %) et MMMU (46,4 %), et Gemini Flash affiche des résultats modérés mais n’atteint pas les scores MathVista.
En conclusionLe GPT-4o mini constitue une alternative convaincante aux modèles précédents comme le GPT-3.5 Turbo et aux concurrents plus récents comme Claude Haiku et Gemini Flash. Bien qu’il ne soit pas aussi avancé que le GPT-4 Turbo ou le Gemini Advanced, le GPT-4o mini se distingue par ses performances améliorées. Sa double capacité à traiter du texte et des images, associée à une fenêtre contextuelle substantielle et à un prix compétitif, le positionne comme un choix polyvalent et accessible pour les entreprises et les développeurs. Malgré la forte concurrence de modèles comme le Gemini Advanced, le nouveau modèle OpenAI offre un mélange équilibré de performances et d’accessibilité, garantissant sa pertinence dans le paysage de l’IA en constante évolution.
Crédits de l’image en vedette : Eray Eliaçık/Bing