Reddit poursuit Anthropic pour utilisation abusive présumée des données des utilisateurs dans la formation de modèles d'IA


Découvrez les principales actualités et événements fintech !

Abonnez-vous à la newsletter de FinTech Weekly

Lue par des dirigeants de JP Morgan, Coinbase, Blackrock, Klarna et bien d’autres


Reddit porte plainte contre Anthropic pour utilisation non autorisée des données utilisateur

Reddit a engagé une action en justice contre la société d’intelligence artificielle Anthropic, l’accusant de violation de ses conditions d’utilisation et d’engager ce que la plateforme qualifie de « pratiques commerciales illégales et déloyales ». La plainte, déposée mercredi devant un tribunal fédéral, intensifie les tensions concernant l’utilisation de contenus web accessibles au public pour entraîner des systèmes d’IA commerciaux.

Selon la plainte, Reddit affirme qu’Anthropic a accédé et utilisé de grandes quantités de contenu généré par ses utilisateurs pour entraîner ses modèles d’IA sans obtenir les permissions ou licences nécessaires. La plateforme sociale soutient que cela viole non seulement ses politiques, mais exploite aussi la contribution de ses utilisateurs à des fins commerciales sans consentement.

L’affaire soulève des questions plus larges sur la propriété du contenu en ligne à l’ère de l’IA générative, et sur la manière dont les entreprises doivent traiter les données publiques qui portent les nuances des attentes en matière de vie privée et de confiance communautaire.

Un défi juridique basé sur l’utilisation du contenu et le gain commercial

Reddit affirme qu’Anthropic, malgré sa présentation comme une entreprise d’IA éthique, a agi en méconnaissance des règles de la plateforme Reddit.

Le cœur de la plainte repose sur l’allégation qu’Anthropic a entraîné ses modèles d’IA—notamment Claude—sur des données Reddit extraites sans autorisation. Reddit souligne que, contrairement à OpenAI et Google, qui ont conclu des accords de licence conformes aux conditions de la plateforme et à la protection des utilisateurs, Anthropic n’a pas obtenu de permissions similaires.

Cette distinction pourrait être un facteur clé dans l’affaire, surtout alors que les entreprises d’IA sont de plus en plus sous pression pour clarifier leurs sources et leur gestion des données d’entraînement, en particulier lorsque ces données proviennent de plateformes avec du contenu généré par les utilisateurs.

Boom de l’IA et tensions sur les plateformes

Depuis la fin 2022, l’IA générative a entraîné des changements importants dans l’industrie technologique, avec des plateformes comme Reddit devenant des réservoirs de valeur pour des insights, discussions et conseils humains. Ces qualités les rendent attractives pour les développeurs d’IA qui construisent des modèles plus performants et contextuellement sensibles.

Reddit s’est lui aussi engagé dans l’économie de l’IA, annonçant récemment des partenariats avec OpenAI et Google permettant à ces entreprises d’utiliser le contenu de Reddit selon des conditions de licence spécifiques. Ces accords visent à préserver la vie privée des utilisateurs tout en permettant de générer des revenus à partir des 20 ans de contenu de la plateforme.

Selon la plainte, l’utilisation par Anthropic des données Reddit s’est faite sans de tels accords, ce qui aurait causé un préjudice financier et réputationnel direct, en citant une utilisation commerciale non autorisée de ses données pour améliorer les produits d’un concurrent.

L’équipe juridique de Reddit a souligné que respecter les règles de la plateforme n’est pas optionnel, surtout dans des secteurs comme la fintech et l’IA où la transparence et la conformité sont de plus en plus scrutées par les utilisateurs et les régulateurs.

Implications pour le marché et réponse de l’industrie

L’action de Reddit a augmenté de plus de 6 % mercredi suite à l’annonce de la plainte, ce qui indique le soutien des investisseurs à la décision de la société de faire respecter ses droits sur ses données. La société, qui est devenue publique début 2024, affiche actuellement une capitalisation d’environ 22 milliards de dollars.

Anthropic, quant à elle, est rapidement devenue l’une des startups d’IA les mieux financées. La société était évaluée à 61,5 milliards de dollars en mars, avec le soutien de grands acteurs comme Amazon, Salesforce Ventures et Cisco Investments.

Bien qu’Anthropic ait déclaré qu’elle n’était pas d’accord avec les affirmations de Reddit, l’issue de la procédure pourrait avoir des implications à long terme sur la façon dont les entreprises d’IA abordent la collecte de données. Elle pourrait également influencer la tarification ou la restriction d’accès aux contenus des plateformes pour l’entraînement.

Des experts du secteur ont souligné que, même si le développement de l’IA implique souvent de scraper des données de domaines publics, la frontière entre « accessible au public » et « utilisable commercialement » reste floue. Des affaires juridiques comme celle-ci pourraient encourager la mise en place de cadres plus précis qui équilibrent innovation et utilisation éthique du contenu.

Accent croissant sur l’éthique des données dans l’IA

L’action en justice de Reddit s’inscrit dans un mouvement plus large où les plateformes commencent à se défendre contre ce qu’elles perçoivent comme une exploitation par les entreprises d’IA. Alors que de plus en plus de sociétés technologiques cherchent à monétiser leurs actifs de données, la licence de contenu devient un terrain de bataille.

Reddit a clairement indiqué dans sa plainte qu’il n’est pas opposé à l’utilisation de ses données pour l’entraînement de l’IA, mais s’oppose à leur utilisation non autorisée. En faisant la distinction entre les entreprises respectant ses conditions—comme OpenAI et Google—et celles qui ne le font pas, Reddit cherche à se positionner comme une plateforme favorable à l’IA tout en protégeant sa communauté d’utilisateurs.

La collaboration existante entre Reddit et OpenAI a été mentionnée dans la plainte, et le lien entre Reddit et Sam Altman, PDG d’OpenAI, ancien membre du conseil d’administration et actionnaire majoritaire, ajoute une complexité supplémentaire au contexte de la procédure.

Ce qui nous attend

Au fur et à mesure que la procédure judiciaire progresse, tous les regards seront tournés vers la manière dont le système juridique traitera la frontière floue entre contenu accessible en ligne et données d’entraînement propriétaires. Cette affaire pourrait établir un précédent pour de futurs litiges entre plateformes de contenu et développeurs d’IA.

Pour l’instant, la contestation juridique de Reddit s’ajoute à la tension croissante sur la façon dont les modèles d’IA sont entraînés et sur le degré auquel les propriétaires de plateformes peuvent ou doivent contrôler l’accès aux données générées par leurs utilisateurs.

Cette plainte renforce également le message selon lequel l’ère du scraping de données non régulée pourrait toucher à sa fin, surtout à mesure que la conscience publique des droits sur les données s’accroît et que les plateformes cherchent à exercer davantage de contrôle sur l’utilisation de leur contenu dans les applications d’IA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)