Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Openai aurait pu former son IA sur des livres volés

byKerem Gülen
avril 3, 2025
in Artificial Intelligence, News
Home Artificial Intelligence

OpenAI fait face à des accusations de formation de ses modèles d’IA sur le matériel protégé par le droit d’auteur sans autorisation, comme un nouveau papier allègue que l’entreprise a utilisé des livres à rémunération d’O’Reilly Media pour former son modèle GPT-4O. Le projet de divulgation de l’IA, un organisme à but non lucratif co-fondé par Tim O’Reilly et Ilan Strauss, a publié le journal.

Les modèles d’IA fonctionnent comme des moteurs de prédiction, des modèles d’apprentissage à partir de données étendues comme des livres et des films à extrapoler à partir des invites. Alors que certains laboratoires d’IA utilisent des données générées par l’IA à mesure que les sources du monde réel diminuent, la formation sur les données purement synthétiques comporte des risques, tels que l’impact des performances d’un modèle.

La méthodologie du journal, Décollerdétermine si un modèle distingue les textes automatisés par l’homme et Paraphrases générées par l’AI. Cela suggère si le modèle a des connaissances préalables à partir de ses données de formation. Les chercheurs ont sondé GPT-4O, GPT-3.5 Turbo et d’autres modèles OpenAI, en utilisant 13 962 extraits de livres 34 O’Reilly pour estimer la probabilité d’inclusion dans les ensembles de données de formation.

Les résultats ont indiqué que GPT-4O a reconnu beaucoup plus de contenu de livres O’Reilly Walwald que les modèles plus anciens comme GPT-3.5 Turbo. Selon le journal, GPT-4O reconnaît probablement de nombreux livres O’Reilly non publics publiés avant sa date de coupure de formation. O’Reilly n’a pas d’accord de licence avec OpenAI, selon le journal.

Les co-auteurs reconnaissent que la méthode n’est pas infaillible et OpenAI a peut-être collecté des extraits dans les entrées ChatGPT des utilisateurs. Une autre mise en garde est que les modèles OpenAI plus récents, y compris GPT-4.5, n’ont pas été évalués.

OpenAI, plaidant pour les restrictions de droit d’auteur plus lâches, a recherché des données de formation de meilleure qualité, embauchant des journalistes pour affiner les résultats du modèle. La société détient également des accords de licence avec des éditeurs de nouvelles et propose des mécanismes d’opt-out pour les propriétaires de droits d’auteur. Openai n’a pas commenté le journal.


Crédit d’image en vedette

Tags: chatteOpenAI

Related Posts

Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes

Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes

mai 9, 2025
Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

mai 9, 2025
La mise en cache implicite vise à réduire les coûts API Gemini de 75%

La mise en cache implicite vise à réduire les coûts API Gemini de 75%

mai 9, 2025
Chatgpt peut désormais analyser vos référentiels GitHub

Chatgpt peut désormais analyser vos référentiels GitHub

mai 9, 2025
Meta Threads a juste eu un peu X-ERIER

Meta Threads a juste eu un peu X-ERIER

mai 9, 2025
Ce robot Amazon a un sentiment de sensation

Ce robot Amazon a un sentiment de sensation

mai 9, 2025

Recent Posts

  • Brad Smith témoigne de l’application Deepseek bloquée par Microsoft pour les employés
  • Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes
  • Apprentissage automatique basé sur un modèle (MBML)
  • Traçage des performances ML
  • Apple développe de nouvelles puces pour les lunettes et les macs intelligents AI

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.