Récemment, un nouveau chatbot nommé gpt2-chatbot est apparu, déroutant les experts par ses capacités et ses origines occultées. Cette arrivée inattendue a suscité une vague de curiosité et déclenché des discussions au sein de la communauté de l’IA.
Qu’est-ce que gpt2 ?
Le nom gpt2-chatbot pourrait laisser croire qu’il s’agit d’une simple extension du modèle de langage GPT-2. Cependant, l’histoire prend une curieuse tournure. gpt2-chatbot prétend être basé sur l’architecture de son successeur, le GPT-4tout en se désignant également sous le nom de « ChatGPT ».
Cette incohérence a alimenté les spéculations sur sa véritable nature. Les experts soupçonnent que l’étiquette « ChatGPT » pourrait être une erreur d’orientation ou le résultat des données de formation reçues.
La question de la paternité vient encore compliquer les choses. gpt2-chatbot revendique systématiquement son fondement dans GPT-4, un modèle développé par OpenAI. Fait intéressant, un tweet de Sam Altman, PDG d’OpenAI semble offrir un indice énigmatique. Altman a initialement appelé le système « gpt-2 » dans un article, puis l’a modifié en « gpt2-chatbot ». Ce changement subtil a amené certains à croire qu’il pourrait y avoir un lien entre OpenAI et gpt2-chatbot, mais les détails restent confidentiels.
j’ai un faible pour gpt2
– Sam Altman (@sama) 30 avril 2024
Le modèle prétend être basé sur l’architecture GPT-4 et s’identifie même comme « ChatGPT », une création OpenAI importante. Toutefois, cette information est difficile à vérifier, car les modèles d’IA peuvent être programmés pour fournir des descriptions trompeuses.
Malgré l’incertitude entourant son créateur, gpt2-chatbot a manifestement fait preuve de capacités impressionnantes.
Il a abordé des tâches de raisonnement complexes telles que l’écriture de code et la résolution de problèmes mathématiques traditionnellement considérés comme difficiles pour les systèmes d’IA. Les chercheurs ont également noté sa volonté de s’affranchir de ses limites et d’explorer des solutions non conventionnelles, un comportement pas généralement observé dans les chatbots précédents.
OpenAI ou cheval noir ?
La question de savoir qui a créé gpt2-chatbot a déclenché une tempête de spéculations. De nombreux chercheurs soupçonnent qu’OpenAI, le laboratoire à l’origine de modèles d’IA révolutionnaires comme ChatGPT, pourrait en être le cerveau. Cette théorie est alimentée par la connexion autoproclamée du modèle à OpenAI et GPT-4. Cependant, certains experts soulignent des incohérences dans ses affirmations, suggérant une potentielle contamination des données lors de la formation.
D’autres pensent que gpt2-chatbot pourrait être l’œuvre d’une entité moins connue en quête de reconnaissance et d’une chance de perturber le paysage de l’IA. Cette possibilité trouve un précédent dans le modèle controversé GPT-4chan, publié en 2022 par un chercheur indépendant.
Quoi qu’il en soit, gpt2-chatbot semble avoir plusieurs capacités impressionnantes :
- Raisonnement et résolution de problèmes: Il peut s’attaquer à des tâches complexes telles que l’écriture de code pour dessiner des images spécifiques (par exemple, une licorne) et résoudre des énigmes logiques difficiles avec lesquelles même GPT-4 a eu du mal.
- Génération de code avancée: Les chercheurs ont constaté qu’il fonctionnait mieux sur les invites de codage que GPT-4 et Claude Opus.
- Briser les règles et s’adapter: Contrairement aux chatbots précédents comme ChatGPT, le gpt2-chatbot semble plus disposé à s’affranchir des restrictions et à explorer des solutions non conventionnelles, conduisant potentiellement à des approches plus créatives.
- Amélioration itérative: Certains utilisateurs ont observé que le modèle pouvait engager un dialogue, affinant ses réponses en fonction des commentaires, suggérant une prise de conscience de ses limites et de son processus de réflexion.
- Planification et recherche: Les chercheurs ont noté que gpt2-chatbot semblait mieux planifier les tâches, suggérant des stratégies améliorées de résolution de problèmes, telles que la génération de requêtes de recherche potentielles et de sites Web à explorer.
Comment essayer gpt-2 ?
Les capacités de gpt2-chatbot peuvent être observées à travers ses performances sur le Arène de chatbot LMSYS plate-forme, où il est comparé à d’autres modèles d’IA à des fins de comparaison. Cela permet aux personnes intéressées de voir comment il se comporte dans diverses tâches.
fournit un terrain d’essai où différents modèles de chatbot peuvent être opposés les uns aux autres sur des tâches spécifiques. Cela permet aux chercheurs et aux développeurs d’évaluer les performances de leurs modèles par rapport aux autres. Outre gpt-2, voici quelques-uns des modèles que vous pourrez trouver sur la plateforme :
- Claude 3
- Lama 3
- Gémeaux
- Flocon de neige Arctique Instruire
- Phi-3
- Mélange d’experts
- GPT-4-Turbo
- GPT-3.5-Turbo
- Reka-Flash
- Commande-R-Plus
- Gemme
- Qwen 1.5
- Zéphyr 141B-A35B
et beaucoup plus.
LMSYS Chatbot Arena élimine les incertitudes liées à la comparaison des modèles d’IA. Il oppose anonymement deux modèles dans un défi face-à-face, vous permettant de voir leurs capacités côte à côte. Une fois que vous avez choisi le gagnant, la plateforme révèle son identité, satisfaisant ainsi votre curiosité quant au modèle qui vous a le plus impressionné.
gpt2-chatbot, avec son arrivée inopinée et ses capacités inattendues, nous rappelle avec force que l’avenir de l’IA pourrait être rempli de telles surprises. À mesure que le secteur avance, des avancées révolutionnaires pourraient émerger de n’importe où, même d’un coin mystérieux d’Internet. Le véritable impact du gpt2-chatbot reste à voir, mais sa présence est un signe avant-coureur de l’avenir passionnant et imprévisible de l’IA.
Crédit image en vedette: COMMUNAUTAIRES/Unsplash