O Reddit processou a startup de IA Anthropic, acusando a empresa de coletar ilegalmente o seu conteúdo para treinar o chatbot Claude. A queixa, apresentada em 4 de junho de 2025, no Tribunal Superior da Califórnia, afirma que a Anthropic acessou os servidores do Reddit mais de 100.000 vezes desde julho de 2024, apesar dos compromissos anteriores de bloquear os seus bots.
De acordo com a ação judicial, a Anthropic violou o acordo de utilizador do Reddit ao usar o conteúdo da plataforma para fins comerciais sem obter uma licença adequada. O Reddit enfatizou que outras grandes empresas de tecnologia, incluindo a OpenAI e o Google, estabeleceram acordos de licenciamento que lhes permitem usar os dados do Reddit para o desenvolvimento de IA. Estes acordos estão supostamente avaliados em até 60 milhões de dólares anualmente.
A Reddit está a procurar tanto indemnizações monetárias como uma ordem judicial para impedir a Anthropic de utilizar qualquer tecnologia treinada com o seu conteúdo. Se concedido, isso poderá impactar diretamente as capacidades de Claude, o modelo de IA da Anthropic.
A Anthropic, que é apoiada pela Amazon e pela Alphabet, negou as alegações e pretende lutar contra o processo em tribunal. O caso adiciona combustível ao debate mais amplo em torno de como as empresas de IA recolhem dados de treino e se as plataformas de conteúdo estão a ser compensadas de forma justa.
O CEO do Reddit, Steve Huffman, tem sido bastante crítico em relação à extração de dados não autorizada. Ele criticou várias empresas de IA — incluindo a Anthropic, a Microsoft e a Perplexity — por usarem os dados do Reddit sem consentimento. Em resposta, o Reddit tomou várias medidas para proteger sua plataforma, incluindo a atualização do seu arquivo robots.txt para bloquear bots não autorizados e a imposição de limites de taxa para conter o acesso massivo a dados.
Esta ação legal ressalta o crescente atrito entre plataformas de conteúdo e desenvolvedores de IA sobre a propriedade e o acesso aos dados. Como as ferramentas de IA generativa dependem cada vez mais de conjuntos de dados massivos, o processo pode abrir um precedente sobre o que é permitido em termos de coleta e uso de dados, especialmente quando o conteúdo se origina de plataformas geradas pelo usuário.