OpenAI semble déprécier le contenu de Reddit pour la formation de chatppt, signalant un pivot vers des sources d’informations plus fiables et vérifiables. Cette décision reflète un changement fondamental dans la façon dont le modèle d’IA est en cours de développement, priorisant la précision sur les données conversationnelles crowdsourcées.
La raison du quart
Pendant des années, Reddit a été une ressource précieuse pour la formation de l’IA car sa vaste gamme de discussions a fourni un style de conversation naturel qui a aidé les modèles à apprendre le dialogue. Cependant, ces données comprenaient également des inconvénients importants, tels que la désinformation, le contenu de faible qualité et les utilisateurs tentant activement de manipuler des discussions pour influencer les réponses de l’IA. Ce changement rapporté fait partie d’une tendance plus large de l’industrie qui fait pression pour l’utilisation de sources de données fiables et vérifiables. L’objectif est d’améliorer la précision du contenu généré par l’IA, de réduire la propagation de la désinformation et de rendre les modèles plus difficiles à manipuler.
Ce que cela signifie pour les utilisateurs
Le décalage de Reddit implique un compromis. Les utilisateurs peuvent s’attendre à recevoir des réponses plus cohérentes et basées sur Chatte. D’un autre côté, la personnalité originale et axée sur la communauté que le contenu diversifié de Reddit a apporté aux réponses du modèle peut s’estomper avec le temps. Cette concentration sur la crédibilité souligne l’avenir du développement de l’IA, où la transparence et la confiance dans les données de formation deviennent essentielles. Comme les modèles d’IA sont de plus en plus intégrés dans les environnements professionnels, académiques et commerciaux, la demande de fiabilité est priorité sur la nature chaotique et imprévisible des forums en ligne non appréciés.