Internet Archive a perdu une bataille juridique importante après que la Cour d’appel des États-Unis a confirmé une décision Hachette v. Internet Archive a statué que ses pratiques de numérisation et de prêt de livres violaient la loi sur le droit d’auteur. L’affaire découlait de l’initiative de la Bibliothèque nationale d’urgence des Archives pendant la pandémie, qui autorisait le prêt numérique sans restriction de livres, déclenchant une réaction négative de la part des éditeurs et des auteurs. Le tribunal a rejeté la défense d’utilisation équitable des Archives, bien qu’il ait reconnu son statut d’organisme à but non lucratif. Cette décision renforce le contrôle des auteurs et des éditeurs sur leurs œuvres. Mais elle me rappelle immédiatement la manière dont les outils d’IA entraînent et utilisent les données sur Internet, y compris les livres et plus encore. Si le travail de l’Internet Archive à but non lucratif n’est pas une utilisation équitable, comment les outils d’IA payants utilisent-ils ces données ?
Malgré de nombreuses Poursuites judiciaires pour atteinte au droit d’auteur sur l’IAdonnées textuelles provenant de organes de presse n’entraîne généralement pas de décisions sévères contre les outils d’IA, se terminant souvent par Partenariats avec acteurs majeurs.
Vous pourriez penser que c’est différent et affirmer que les archives Internet utilisent directement des livres, mais même si les outils d’IA s’appuient sur toutes les données dont ils disposent pour générer votre essai, vous pouvez toujours obtenir des extraits spécifiques ou des réponses plus détaillées de leur part si vous utilisez une invite bien conçue.
L’affaire Hachette c. Internet Archive met en lumière des inquiétudes importantes quant à la manière dont les modèles d’IA acquièrent des données d’entraînement, en particulier lorsqu’il s’agit de documents protégés par le droit d’auteur comme des livres. Les systèmes d’IA s’appuient souvent sur de grands ensembles de données, notamment des textes protégés par le droit d’auteur, ce qui soulève des problèmes juridiques similaires concernant l’utilisation sans licence. Si les tribunaux restreignent la numérisation et l’utilisation d’œuvres protégées par le droit d’auteur sans autorisation, les entreprises d’IA pourraient devoir obtenir des licences pour les textes utilisés dans la formation, ce qui ajouterait de la complexité et des coûts potentiels. Cela pourrait limiter l’accès à des ensembles de données diversifiés et de haute qualité, ce qui affecterait à terme le développement et l’innovation en matière d’IA.
En outre, l’affaire souligne les limites de la utilisation équitable La défense dans le contexte d’une utilisation transformatrice, qui est souvent au cœur de la justification de l’IA pour l’utilisation de données textuelles à grande échelle. Si les tribunaux se limitent à une vision restrictive de ce qui constitue une utilisation équitable, les développeurs d’IA pourraient être confrontés à davantage de restrictions sur la manière dont ils accèdent aux livres protégés par le droit d’auteur et les utilisent. Cette tension entre la protection des droits des auteurs et le maintien d’un accès ouvert aux connaissances pourrait avoir des conséquences de grande portée sur l’avenir des pratiques de formation de l’IA et l’utilisation éthique des données.
Vous avez besoin d’approfondir le sujet ? Voici tout ce que vous devez savoir à ce sujet.
Explication de l’affaire Hachette contre Internet Archive
Hachette c. Internet Archive est une affaire judiciaire importante qui porte sur le droit d’auteur et les limites de la doctrine de « l’usage équitable » dans le contexte des bibliothèques numériques. L’affaire a débuté en 2020, lorsque plusieurs grandes maisons d’édition (Hachette, HarperCollins, Penguin Random House et Wiley) ont poursuivi Internet Archive, une organisation à but non lucratif dédiée à la préservation des copies numériques de sites Web, de livres et d’autres médias.
L’affaire portait sur la pratique des Archives consistant à numériser des livres et à les prêter en ligne.
L’histoire derrière le procès contre Internet Archive
Le Bibliothèque ouverte Le projet, géré par l’Internet Archive, a été mis en place pour permettre aux gens d’emprunter des livres sous forme numérique. Voici comment cela a fonctionné :
- Internet Archive a acheté des copies physiques de livres.
- Ils ont numérisé ces livres sous forme numérique.
- Les gens pourraient emprunter une version numérique, mais une seule personne à la fois pourrait consulter un livre, tout comme on emprunte un livre physique dans une bibliothèque ordinaire.
Les archives Internet pensaient que cela était légal car elles ne permettaient qu’à une seule personne d’emprunter un livre à la fois. Ils ont appelé ce système Prêts numériques contrôlés (CDL)L’idée était de faire en sorte que le prêt numérique fonctionne de la même manière que le prêt en bibliothèque physique.
Lorsque la pandémie de COVID-19 a frappé au début de l’année 2020, de nombreuses bibliothèques ont dû fermer, ce qui a rendu difficile l’accès aux livres pour les personnes. Pour aider, l’Internet Archive a lancé le Bibliothèque nationale d’urgence (NEL) en mars 2020. Ce programme a changé les choses :
- La NEL permettait à plusieurs personnes d’emprunter simultanément la même copie numérique d’un livre. Cela a supprimé la règle d’une personne à la fois.
- L’objectif était de permettre à davantage de personnes d’accéder aux livres pendant la pandémie, en particulier aux étudiants et aux chercheurs coincés à la maison.
La NEL était censée être temporaire, mais elle a contrarié les auteurs et les éditeurs. Selon eux, autoriser de nombreuses personnes à emprunter la même copie numérique sans autorisation équivalait à voler leur œuvre.
L’émeute des éditeurs
En juin 2020, les grands éditeurs ont intenté un procès contre Internet Archive. Ils ont affirmé :
- Les archives Internet n’avaient pas l’autorisation de numériser leurs livres ni de les prêter sous forme numérique.
- Ce faisant, Internet Archive violait son droit d’auteur, qui lui donne le droit exclusif de contrôler la manière dont ses livres sont copiés et partagés.
- L’approche de la NEL, qui permettait à de nombreuses personnes d’emprunter des copies numériques en une seule fois, était particulièrement préjudiciable à son activité et constituait essentiellement du piratage.
Les éditeurs ont fait valoir que les actions d’Internet Archive nuisaient au marché de leurs livres. Ils ont affirmé que les gens obtenaient des versions numériques gratuites au lieu d’acheter des livres électroniques ou d’emprunter des livres auprès de bibliothèques agréées.
Défense des archives Internet
L’Internet Archive s’est défendu en affirmant que son travail était protégé par utilisation équitable. L’usage équitable autorise une utilisation limitée de matériel protégé par le droit d’auteur sans autorisation à des fins telles que l’éducation, la recherche et les commentaires. Les Archives ont fait valoir les points suivants :
- Ils fournissaient un transformateur service en donnant aux lecteurs l’accès à des livres physiques sous une nouvelle forme numérique.
- Ils ne tiraient aucun profit de cette activité, car ils étaient une organisation à but non lucratif dont la mission était de préserver les connaissances et de les rendre accessibles.
- La NEL était une réponse temporaire à la pandémie et essayait d’aider les personnes qui ne pouvaient pas accéder aux livres pendant la crise.
Ils ont également souligné leur Prêts numériques contrôlés système comme moyen de respecter les lois sur le droit d’auteur. En vertu du CDL, une seule personne à la fois pouvait emprunter un livre, comme dans une bibliothèque physique.
Les décisions du tribunal
Décision du tribunal de district (mars 2023)
En mars 2023, un tribunal fédéral a donné raison aux éditeurs. Le juge John G. Koeltl a statué que les actions d’Internet Archive n’étaient pas protégées par le fair use. Il a déclaré :
- Le prêt numérique des archives Internet n’était pas transformateur parce qu’ils n’ajoutaient rien de nouveau aux livres. Ils les copiaient simplement sous forme numérique, ce qui n’était pas suffisant pour être considéré comme un usage équitable.
- Le tribunal a également estimé que le prêt des archives nuisait au marché des versions imprimées et numériques des livres. En proposant des copies numériques gratuites, Internet Archive était perçu comme faisant concurrence aux ventes de livres électroniques des éditeurs.
- La cour conclu que les Archives avaient créé œuvres dérivéesce qui signifie qu’ils ont fait de nouvelles versions des livres (copies numériques) sans autorisation.
Décision de la Cour d’appel (août 2023)
L’Internet Archive a fait appel de la décision devant une juridiction supérieure, la Cour d’appel du deuxième circuit des États-Unis, dans l’espoir d’obtenir l’annulation de la décision. Cependant, la cour d’appel a également statué en faveur des éditeurs, mais a apporté une précision importante :
- Le tribunal a reconnu que l’Internet Archive est un à but non lucratif Il s’agissait d’une organisation et non d’une organisation commerciale. Cette distinction était importante car l’utilisation commerciale peut souvent affaiblir une défense d’utilisation équitable, mais dans ce cas, le tribunal a reconnu que les Archives n’étaient pas motivées par le profit.
- Malgré cela, le tribunal a néanmoins convenu que les actions des Archives n’étaient pas protégées par un usage équitable, même s’il s’agit d’une organisation à but non lucratif.
En conclusion
L’affaire Hachette contre Internet Archive a montré que même les organisations à but non lucratif comme Internet Archive ne peuvent pas numériser et prêter librement des livres sans violer les lois sur le droit d’auteur. Cette décision pourrait également avoir une incidence sur la manière dont les entreprises d’IA utilisent les matériaux protégés par le droit d’auteur pour entraîner leurs systèmes. Si les organisations à but non lucratif sont confrontées à de telles restrictions, les outils d’IA pourraient devoir obtenir des licences pour les données qu’elles utilisent. Même si elles en ont déjà a commencé à conclure quelques affairesJe me demande, qu’en est-il de la premières entrées?
Crédits de l’image en vedette : Eray Eliaçık/Bing