Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Openai ajoute un filtre à menace à ses modèles les plus intelligents

byKerem Gülen
avril 17, 2025
in Artificial Intelligence, Cybersecurity, News
Home Artificial Intelligence

OpenAI a introduit un nouveau système de surveillance pour ses derniers modèles d’IA, O3 et O4-MinI, pour détecter et prévenir les invites liées aux menaces biologiques et chimiques, selon la sécurité de la société rapport. Le système, décrit comme un «moniteur de raisonnement axé sur la sécurité», est conçu pour identifier les demandes potentiellement dangereuses et demander aux modèles de refuser de fournir des conseils.

Les nouveaux modèles d’IA représentent une augmentation significative des capacités par rapport aux modèles précédents d’OpenAI et posent de nouveaux risques s’ils sont mal utilisés par des acteurs malveillants. L’O3, en particulier, a montré une compétence accrue dans la réponse aux questions liées à la création de certaines menaces biologiques, selon les références internes d’OpenAI. Pour atténuer ces risques, le système de surveillance a été formé sur mesure pour raisonner sur les politiques de contenu d’OpenAI et se déroule sur O3 et O4-MinI.

Openai ajoute un filtre à menace à ses modèles les plus intelligents
Image: Openai

Pour développer le système de surveillance, les Teamers Red d’Openai ont passé environ 1 000 heures à signaler les conversations liées au biorisque «dangereuses» à partir d’O3 et d’O4-MinI. Dans un test simulé, les modèles ont refusé de répondre aux invites à risque 98,7% du temps. Cependant, OpenAI reconnaît que ce test ne tenait pas compte des utilisateurs qui pourraient essayer de nouvelles invites après avoir été bloquées, et la société continuera de s’appuyer sur la surveillance humaine.

Selon OpenAI, O3 et O4-MINI ne franchissent pas le seuil de «risque élevé» pour les biorisques. Pourtant, les premières versions de ces modèles se sont révélées plus utiles pour répondre aux questions liées au développement d’armes biologiques par rapport à O1 et GPT-4. La société suit activement les risques potentiels associés à ses modèles et s’appuie de plus en plus sur des systèmes automatisés pour atténuer ces risques.

OpenAI utilise un moniteur de raisonnement similaire pour empêcher le générateur d’images natif de GPT-4O de créer du matériel d’abus sexuel pour enfants (CSAM). Cependant, certains chercheurs ont soulevé des inquiétudes selon lesquelles OpenAI ne privilégie pas autant la sécurité, citant un temps limité pour tester l’O3 sur une référence pour un comportement trompeur et l’absence d’un rapport de sécurité pour GPT-4.1.


Crédit d’image en vedette

Tags: chatteOpenAI

Related Posts

Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes

Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes

mai 9, 2025
Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

mai 9, 2025
La mise en cache implicite vise à réduire les coûts API Gemini de 75%

La mise en cache implicite vise à réduire les coûts API Gemini de 75%

mai 9, 2025
Chatgpt peut désormais analyser vos référentiels GitHub

Chatgpt peut désormais analyser vos référentiels GitHub

mai 9, 2025
Meta Threads a juste eu un peu X-ERIER

Meta Threads a juste eu un peu X-ERIER

mai 9, 2025
Ce robot Amazon a un sentiment de sensation

Ce robot Amazon a un sentiment de sensation

mai 9, 2025

Recent Posts

  • Brad Smith témoigne de l’application Deepseek bloquée par Microsoft pour les employés
  • Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes
  • Apprentissage automatique basé sur un modèle (MBML)
  • Traçage des performances ML
  • Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.