OpenAI a fait la une des journaux aujourd’hui avec son annonce de la disponibilité générale de GPT-4 pour les développeurs via l’API GPT-4. À partir de cet après-midi, les développeurs d’API OpenAI existants, reconnus pour leur « historique de paiements réussis », auront accès aux capacités sophistiquées de GPT-4. La feuille de route d’OpenAI indique également un déploiement étendu aux nouveaux développeurs d’ici la fin du mois, avec des plans ultérieurs pour un incrément de disponibilité plus large « en fonction de la disponibilité du calcul ».
L’intérêt pour l’API GPT-4 a augmenté depuis mars, avec « des millions de développeurs demandant un accès ». OpenAI a partagé dans un article de blog le spectre passionnant des innovations en cours à l’aide de GPT-4, et a articulé une vision pour un avenir où « les modèles basés sur le chat peuvent prendre en charge n’importe quel cas d’utilisation ».
OpenAI pousse l’API GPT-4 au public
Ce qui distingue GPT-4 de son prédécesseur, GPT-3.5, est sa capacité améliorée à générer du texte, y compris du code, tout en prenant en charge les entrées d’image et de texte. La performance « humaine » du modèle sur une variété de repères professionnels et académiques souligne encore sa progression remarquable. Comme avec les modèles GPT précédents d’OpenAI, GPT-4 utilise un programme de formation comprenant des données accessibles au public, telles que celles provenant de pages Web publiques, en conjonction avec des données sous licence.
Cependant, le dévoilement de la fonctionnalité de compréhension d’image a été soigneusement orchestré. OpenAI a actuellement collaboré avec un seul partenaire, Be My Eyes, pour les tests préliminaires. Un calendrier pour étendre cette capacité à une clientèle plus large reste indéterminé.
Avez-vous vraiment besoin de GPT-4 ?
Bien que GPT-4 représente une étape importante dans les modèles d’IA générative, il est important de souligner qu’il n’est pas sans limites. Le modèle « hallucine » parfois des faits, fait des erreurs de raisonnement, parfois avec confiance. Un défi particulier avec lequel il se débat est de ne pas apprendre de l’expérience, ce qui conduit à des problèmes potentiels tels que l’injection de vulnérabilités de sécurité dans le code généré.
En termes de développements futurs, OpenAI a clairement indiqué ses intentions de permettre aux développeurs d’affiner à la fois GPT-4 et son homologue un peu moins puissant, GPT-3.5 Turbo. Ces personnalisations, facilitées par l’utilisation des propres données des développeurs, s’alignent sur les capacités de personnalisation de plusieurs autres modèles de génération de texte OpenAI. Selon OpenAI, les développeurs devraient pouvoir anticiper l’arrivée de cette nouvelle fonctionnalité plus tard cette année.
À la suite de la révélation de GPT-4 en mars, le paysage de l’IA générative a connu une escalade spectaculaire de la concurrence. Anthropic, un concurrent notable, a récemment amplifié la fenêtre de contexte de Claude, son principal modèle d’IA générant du texte encore en avant-première, l’étendant de 9 000 à 100 000 jetons. Cette fenêtre contextuelle fait référence au segment de texte que le modèle considère avant de générer du texte supplémentaire, avec des jetons représentant des morceaux de texte brut. Par exemple, le mot « ordinateur » serait divisé en jetons « com », « put » et « er ».
Auparavant, GPT-4 détenait le record de la plus grande fenêtre contextuelle, avec un impressionnant 32 000 jetons à l’extrémité supérieure. En général, les modèles avec des fenêtres contextuelles limitées ont tendance à « oublier » le contenu des conversations, même récentes, ce qui les conduit à s’éloigner.
Dans une annonce simultanée, OpenAI a divulgué la disponibilité générale de ses API DALL-E 2 et Whisper. Le premier est le modèle de génération d’images d’OpenAI tandis que le second, « Whisper », désigne le modèle de synthèse vocale de l’entreprise. OpenAI a également partagé ses plans pour éliminer progressivement les anciens modèles disponibles via son API dans le but «d’optimiser [its] capacité de calcul. La décision survient en réponse aux récentes luttes d’OpenAI pour répondre à la demande croissante de ses modèles génératifs, une augmentation largement attribuable à la popularité explosive de ChatGPT.
Comment ChatGPT peut-il générer des clés Windows : une interview
Dans le cadre de cette transition, à partir du 4 janvier 2024, certains modèles OpenAI plus anciens, en particulier GPT-3 et ses variantes, seront abandonnés et remplacés par un nouvel ensemble de modèles « GPT-3 de base », supposément conçus pour une plus grande efficacité de calcul. Les développeurs dépendant des anciens modèles devront mettre à jour manuellement leurs intégrations d’ici le 4 janvier. .
« Nous fournirons une assistance aux utilisateurs qui ont précédemment affiné les modèles pour rendre cette transition aussi fluide que possible », a écrit OpenAI. « Dans les semaines à venir, nous contacterons les développeurs qui ont récemment utilisé ces anciens modèles et fournirons plus d’informations une fois que les nouveaux modèles d’achèvement seront prêts pour les premiers tests. »
10 choses que vous pouvez faire avec l’API GPT-4
- Avec les capacités narratives étendues de l’API GPT-4, la génération de romans complexes, avec des intrigues alambiquées et un développement approfondi des personnages, révolutionne le domaine de la création littéraire.
- L’API GPT-4 ouvre la voie à l’émulation de dialogues étonnamment réalistes, reflétant l’authenticité et la précision des interactions humaines.
- L’API GPT-4 met en valeur la maîtrise de la traduction linguistique instantanée, comblant efficacement les lacunes de communication dans un large éventail de langues et de cultures.
- L’API GPT-4, armée d’analyses de données avancées, facilite les prédictions précises des tendances du marché boursier, fournissant des informations inestimables aux acteurs du marché.
- Avec la possibilité de créer des environnements virtuels très réalistes qui font écho à la dynamique du monde réel, l’API GPT-4 améliore l’immersion dans des domaines tels que les jeux et la réalité virtuelle.
- La capacité de l’API GPT-4 à générer du code informatique complexe en fait un allié indispensable pour les développeurs de logiciels.
- L’API GPT-4 peut interpréter et analyser des données médicales, aidant au diagnostic précis et à la prédiction de divers problèmes de santé.
- Tirant parti de ses prouesses avancées en matière de génération de langage, l’API GPT-4 garantit la génération rapide et précise de documents juridiques.
- L’API GPT-4 démontre une capacité à interpréter les données des consommateurs et à générer un contenu marketing personnalisé, résonnant efficacement avec les publics ciblés.
- L’API GPT-4 a le potentiel de stimuler l’innovation scientifique en analysant de vastes volumes de données scientifiques pour découvrir de nouvelles perspectives dans des domaines aussi divers que la chimie, la physique et la biologie.
Crédit image en vedette : Jonathan Kemper/Unsplash