La révélation a émergé de documents juridiques déclassifiés qui dressent un portrait troublant de la manière dont Meta a acquis une immense quantité de contenus sous droits d’auteur. Selon ces documents, l’équipe de Meta aurait accédé à Library Genesis (LibGen)—un site de piratage bien connu—pour obtenir des livres sous droits d’auteur. Et cela ne s’arrête pas là.
Meta aurait utilisé BitTorrent, un système de partage de fichiers en pair à pair, pour télécharger ces documents. Bien qu’ils aient tenté de minimiser leur empreinte en configurant leur logiciel « LibTorrent » pour semer le moins possible, ils ont tout de même redistribué du contenu piraté.
Encore plus alarmant ? Mark Zuckerberg aurait lui-même approuvé cette décision, en dépit des avertissements internes de l’équipe d’IA de l’entreprise.
Les Conséquences Juridiques
En réaction à ces révélations, les plaignants ont renforcé leur action en justice avec deux nouvelles accusations :
- Violation du Digital Millennium Copyright Act (DMCA) – Meta aurait supprimé les avis de droits d’auteur des livres téléchargés, une pratique strictement interdite par la loi.
- Violation de la California Comprehensive Computer Data Access and Fraud Act (CDAFA) – En accédant à du contenu piraté via des réseaux torrent, Meta pourrait avoir accédé illégalement à des systèmes informatiques.
Sans surprise, Meta tente de se défendre en invoquant la doctrine du « fair use » (usage équitable), arguant que l’utilisation de ces œuvres pour entraîner des modèles d’IA est transformative et donc légalement permise. Toutefois, la suppression délibérée des informations sur le droit d’auteur affaiblit considérablement cet argument, car les tribunaux considèrent souvent cette pratique comme une preuve de mauvaise foi.
Un Problème Plus Large pour l’Industrie de l’IA
Cette affaire s’inscrit dans un débat plus large sur l’entraînement des modèles d’IA. Toute l’industrie repose sur d’immenses bases de données, souvent issues du web et comprenant des livres, articles et images—dont bon nombre sont protégés par des droits d’auteur. Certaines entreprises plaident pour une utilisation « équitable », tandis que les auteurs et créateurs de contenu considèrent cela comme du vol pur et simple.
Fait intéressant, les tribunaux ont rendu des décisions contradictoires à ce sujet. Certains procès contre des entreprises d’IA ont été rejetés, tandis que d’autres, comme celui contre Meta, ont gagné en importance. Cette incertitude juridique maintient les développeurs d’IA et les créateurs de contenu dans un affrontement à enjeux élevés qui pourrait redéfinir les pratiques futures en matière d’entraînement des IA.
Que Va-t-il se Passer Ensuite ?
Si Meta est reconnue coupable de violations du DMCA, elle pourrait être condamnée à de lourdes amendes et contrainte de modifier ses méthodes d’entraînement d’IA. Cette affaire pourrait également créer un précédent pour d’autres entreprises, les obligeant à acheter des licences légales plutôt que de recourir au piratage et à la suppression de droits d’auteur.
Une chose est sûre—la course à la domination de l’IA pousse certaines entreprises à flirter avec des zones grises éthiques et juridiques. Et si les accusations portées contre Meta se confirment, cela signifie que certains sont prêts à prendre de gros risques pour garder une longueur d’avance.