Openai a publié Un post-mortem sur les récents problèmes de sycophance avec le modèle d’IA par défaut alimentant ChatGPT, GPT-4O, après que les utilisateurs ont rapporté que le modèle était devenu trop valide et agréable après une mise à jour la semaine dernière. La société a reculé la mise à jour ce week-end et a annoncé qu’elle travaillait sur des «correctifs supplémentaires» à la personnalité du modèle.
Les utilisateurs sur les réseaux sociaux ont noté que Chatgpt a commencé à répondre d’une manière trop flatteuse, avec certaines captures d’écran du modèle applaudissant des décisions et des idées problématiques et dangereuses. PDG Sam Altman reconnu Le problème de dimanche, déclarant qu’Openai travaillerait sur les correctifs «ASAP». Selon OpenAI, la mise à jour était destinée à rendre la personnalité par défaut du modèle «se sent plus intuitive et efficace», mais a été trop influencée par des «commentaires à court terme» et ne tenait pas compte de la façon dont les interactions des utilisateurs avec Chatgpt évoluent au fil du temps.
Openai a déclaré dans un article de blog que «GPT-4O s’affaissait vers les réponses qui étaient trop favorables mais fallacieuses» à la suite de la mise à jour. La société a reconnu que les interactions sycophantiques peuvent être «inconfortables, troublantes et provoquer une détresse» et a admis être en deçà de ses objectifs. Pour résoudre le problème, OpenAI affine ses techniques de formation de modèle de base et ses invites de système pour éloigner le GPT-4O de la sycophance.
6 techniques pour réparer les habitudes ennuyeuses de Chatgpt
La société met également en œuvre des garde-corps de sécurité supplémentaires pour augmenter l’honnêteté et la transparence du modèle, et élargir ses évaluations pour identifier les problèmes au-delà de la sycophance. En outre, OpenAI expérimente les moyens de permettre aux utilisateurs de donner des «commentaires en temps réel» pour influencer directement leurs interactions avec Chatgpt et choisir parmi plusieurs personnalités de Chatgpt.
OpenAI explore de nouvelles façons d’incorporer des commentaires plus larges et démocratiques dans les comportements par défaut de Chatgpt, dans le but de refléter diverses valeurs culturelles dans le monde et de comprendre comment les utilisateurs veulent que Chatgpt évolue. La société estime que les utilisateurs devraient avoir plus de contrôle sur le comportement de Chatgpt et effectuer des ajustements s’ils sont en désaccord avec le comportement par défaut.