
Une IA pourra être nourrie avec un livre sans autorisation ni droits d'auteur, dit la justice américaine

Un juge américain a estimé lundi que la société Anthropic pouvait entraîner ses modèles d'intelligence artificielle (IA) avec des livres protégés par des droits d'auteur sans la permission de ces derniers, une décision qui peut marquer une étape majeure dans le développement de l'IA.
Selon un juge fédéral de première instance à San Francisco, l'entraînement de ces modèles d'IA Claude avec des livres, achetés ou non, est permis par la doctrine de "l'usage raisonnable" de la législation américaine sur les droits d'auteur.
"L'utilisation des livres en question dans le but d'entraîner Claude a engendré des évolutions spectaculaires et relevait de l'usage raisonnable", écrit le juge dans sa décision.
Il a qualifié l'IA de "technologie parmi les plus révolutionnaires que beaucoup d'entre nous verront dans leur vie" et comparé l'apprentissage d'une IA à celui que les êtres humains effectuent en lisant des livres.
D'énormes quantités de données sont nécessaires pour entraîner les modèles linguistiques l'IA générative, comme ChatGPT, un des rivaux de Claude.
Anthropic, évaluée à 61,5 milliards de dollars et largement soutenue par Amazon, a été fondée en 2021 par d'anciens ingénieurs d'OpenAI, la société qui a développé Chat GPT. Elle promeut, plus ostensiblement que ses concurrents, un développement responsable de l'IA.
Nombre de musiciens, artistes, médias et écrivains -comme Andrea Bartz, Charles Graeber et Kirk Wallace Johnson avec Anthropic- ont intenté des actions en justice contre plusieurs sociétés d'IA ayant utilisé leurs données sans permission ni paiement.
Ces sociétés se défendent en général en brandissant la doctrine de l'usage raisonnable, arguant que l'entraînement d'IA sur de larges quantités de données transforme radicalement les contenus originaux et est nécessaire pour l'innovation.
Par la voix d'un porte-parole, Anthropic s'est félicité que "le juge ait reconnu qu'utiliser des travaux pour entraîner les grands modèles était source d'innovation". Cette décision "est cohérente avec l'objectif de la législation sur les droits d'auteur de permettre la créativité et de favoriser le progrès scientifique", selon la même source.
Le juge s'est toutefois gardé d'accorder à Anthropic un blanc-seing, estimant que sa pratique de télécharger des millions de livres piratés pour constituer une bibliothèque numérique permanente n'était pas compatible avec un usage raisonnable.
Car en plus d'avoir téléchargé des livres piratés, la société a acheté des livres pour les scanner et les conserver en format numérique, selon des documents de justice.
Et Anthropic visait à assembler une bibliothèque "de tous les livres du monde" pour entraîner ses modèles d'IA à loisir, selon le juge qui a estimé qu'il s'agissait là d'une violation des droits d'auteur, quel que soit l'objectif poursuivi.
La décision rendue lundi est préliminaire et le dossier va ensuite faire l'objet d'un procès au civil pour déterminer s'il convient d'infliger à Anthropic d'éventuels dommages et intérêts.
A. Ribeiro--JDB