Reddit poursuit Anthropic pour des allégations de collecte de données non autorisée pour l'entraînement de l'IA

2025-06-04 21:19:37

Création du résumé en cours

Reddit a intenté une action en justice contre la startup d'IA Anthropic, accusant la société d'avoir illégalement extrait son contenu pour entraîner le chatbot Claude. La plainte, déposée le 4 juin 2025, devant la Cour supérieure de Californie, affirme qu'Anthropic a accédé aux serveurs de Reddit plus de 100 000 fois depuis juillet 2024, malgré des engagements antérieurs à bloquer ses bots.

Reddit revendique une violation de l'accord d'utilisateur

Selon le procès, Anthropic a violé l'accord d'utilisateur de Reddit en utilisant le contenu de la plateforme à des fins commerciales sans obtenir de licence appropriée. Reddit a souligné que d'autres grandes entreprises technologiques, y compris OpenAI et Google, ont établi des accords de licence leur permettant d'utiliser les données de Reddit pour le développement de l'IA. Ces accords seraient d'une valeur allant jusqu'à 60 millions de dollars par an.

Reddit cherche à obtenir à la fois des dommages-intérêts et une ordonnance du tribunal pour empêcher Anthropic d'utiliser toute technologie formée sur son contenu. Si cela est accordé, cela pourrait avoir un impact direct sur les capacités de Claude, le modèle d'IA d'Anthropic.

Tensions croissantes concernant les pratiques de données en IA

Anthropic, qui est soutenu par Amazon et Alphabet, a nié les allégations et a l’intention de se battre contre le procès devant les tribunaux. L’affaire alimente le débat plus large sur la façon dont les entreprises d’IA recueillent des données d’entraînement et sur la question de savoir si les plateformes de contenu sont rémunérées équitablement.

Le PDG de Reddit, Steve Huffman, s'est exprimé de manière virulente contre le scraping de données non autorisé. Il a critiqué plusieurs entreprises d'IA - y compris Anthropic, Microsoft et Perplexity - pour avoir utilisé les données de Reddit sans consentement. En réponse, Reddit a pris plusieurs mesures pour protéger sa plateforme, y compris la mise à jour de son fichier robots.txt pour bloquer les bots non autorisés et l'application de limites de taux pour réduire l'accès massif aux données.

Cette action en justice souligne la friction croissante entre les plateformes de contenu et les développeurs d'IA concernant la propriété et l'accès aux données. Alors que les outils d'IA générative dépendent de plus en plus de vastes ensembles de données, le procès pourrait établir un précédent sur ce qui est permis en matière de collecte et d'utilisation des données, en particulier lorsque le contenu provient de plateformes générées par les utilisateurs.

OVER-4.51%

Voir l'original

Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.

Récompense
J'aime
Commentaire
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
#PI#
308k publications
#BTC#
272k publications
#ETH#
180k publications
4#GateioInto11#
83k publications
5#GT#
71k publications
6#ContentStar#
69k publications
7#DOGE#
64k publications
8#BOME#
62k publications
9#MAGA#
53k publications
10#SLERF#
51k publications

Épingler