banner
Centre d'Information
Nos efforts conjoints produiront un résultat satisfaisant.

Les poursuites contre AI expliquées : qui est poursuivi ?

May 15, 2024

Getty Images/iStockphoto

Beaucoup de gens pensent qu’il est temps que les sociétés d’IA financent les repas de données gratuits qui ont rendu leurs systèmes génératifs grands et forts.

Récemment, une série de poursuites judiciaires exigeant des compensations de la part des sociétés d’IA ont été déposées aux États-Unis et en Europe. Les plaignants comprennent des auteurs et des artistes, qui ont constamment exprimé leur inquiétude quant au vol de leurs œuvres par l’IA et à la production de produits dérivés médiocres.

Une lettre ouverte de la Authors Guild – signée par plus de 8 500 auteurs, dont Margaret Atwood, Dan Brown et Jodi Picoult – exhorte les entreprises technologiques responsables des applications d'IA générative, telles que ChatGPT et Bard, à cesser d'utiliser leurs œuvres sans autorisation appropriée. ou une indemnisation. Les auteurs veulent que les entreprises paient pour les données qu'elles ont récupérées pour la formation – la « nourriture » des systèmes d'IA, des repas sans fin pour lesquels il n'y a pas de facture.

Les auteurs expriment également leur inquiétude quant au fait que l’IA générative menace leur profession en inondant le marché de contenu écrit automatiquement et basé sur leur travail. C'était un problème ces derniers mois, car Amazon a pris des mesures contre les auteurs d'IA qui spamment la liste des best-sellers avec les œuvres générées.

Avant la publication de la lettre de la Authors Guild, deux auteurs nord-américains – Mona Awad et Paul Tremblay – ont intenté une action en justice contre OpenAI, affirmant que l'organisation avait violé la loi sur le droit d'auteur. La poursuite faisait valoir qu'OpenAI avait violé la loi sur le droit d'auteur parce que ChatGPT générait des résumés précis des œuvres de l'auteur et, par conséquent, devait s'être formé sur les œuvres des auteurs.

Ils ne sont pas les seuls. L'auteur et comédienne Sarah Silverman poursuit également OpenAI et Meta pour avoir reproduit illégalement ses mémoires, The Bedwetter, sans autorisation. Cependant, cet argument pourrait ne pas tenir devant les tribunaux en raison du fonctionnement de l’IA générative.

L'IA générative est la technologie qui alimente ChatGPT et Bard. L'IA générative basée sur le texte utilise des algorithmes pour prédire les prochains mots probables du texte et génère ce texte en fonction d'une invite de l'utilisateur. ChatGPT sait quoi générer car il a été formé sur un vaste corpus de données accessibles au public sur Internet. Il a appris des modèles grâce à la formation et fait correspondre ces modèles aux invites de l'utilisateur.

Les IA génératives sont généralement des systèmes d’IA en boîte noire, ce qui signifie que personne – pas même les programmeurs – ne comprend les étapes exactes que suit la machine pour passer de l’entrée à la sortie. L’entrée entre, la magie opère et la sortie sort.

Tous les outils d’apprentissage automatique et d’IA générative utilisent des œuvres préexistantes.

Les gens poursuivent les sociétés d’IA pour droits d’auteur. Même si ChatGPT est formé sur les données provenant d'Internet, il le fait sans l'autorisation des créateurs de données. Par exemple, GPT-3 a été formé sur Wikipédia et Reddit, entre autres sources. Cependant, des conversations sur des segments d'œuvres protégées par le droit d'auteur pourraient exister dans le matériel de formation et fournir aux grands modèles linguistiques suffisamment de contexte pour résumer avec précision ces œuvres protégées par le droit d'auteur.

À plus grande échelle, les gens intentent des poursuites parce que l’IA est une boîte noire et qu’il est impossible de savoir comment elle fonctionne à un niveau granulaire. La crainte est que les gens utilisent l’IA pour éviter d’assumer la responsabilité de leurs décisions ou des choses qu’elle produit.

"Si les sociétés d'IA sont autorisées à commercialiser des systèmes d'IA qui sont essentiellement des boîtes noires, elles pourraient devenir les dispositifs ultimes qui justifient les moyens", a écrit Matthew Butterick, l'un des avocats à l'origine de plusieurs poursuites, sur son blog. "D'ici peu, nous ne déléguerons pas de décisions aux systèmes d'IA parce qu'ils fonctionnent mieux. Nous déléguerons plutôt des décisions aux systèmes d'IA parce qu'ils peuvent s'en sortir avec tout ce que nous ne pouvons pas faire."

De nombreuses poursuites ont été intentées contre des sociétés d’IA générative concernant les droits d’auteur et les abus. Voici quelques-unes des entreprises poursuivies.

Un recours collectif a été déposé contre ces sociétés concernant l'outil Copilot de GitHub. L'outil génère de manière prédictive du code basé sur ce que le programmeur a déjà écrit. Les plaignants allèguent que Copilot copie et republie le code de GitHub sans respecter les exigences de la licence open source de GitHub, par exemple en omettant de fournir une attribution. La plainte comprend également des allégations liées à la mauvaise gestion des données et informations personnelles par GitHub, ainsi que des allégations de fraude. La plainte a été déposée en novembre 2022. Microsoft et GitHub ont tenté à plusieurs reprises de faire classer l'affaire.