Reddit kiện Anthropic về việc sử dụng sai trái dữ liệu người dùng trong đào tạo mô hình AI

SleepTrader

2026-02-20 23:22:26

Khám phá các tin tức và sự kiện fintech hàng đầu!

Đăng ký nhận bản tin của FinTech Weekly

Được đọc bởi các giám đốc điều hành tại JP Morgan, Coinbase, Blackrock, Klarna và nhiều hơn nữa

Reddit kiện Anthropic về việc sử dụng trái phép dữ liệu người dùng

Reddit đã tiến hành kiện chống lại công ty trí tuệ nhân tạo Anthropic, cáo buộc startup này vi phạm điều khoản dịch vụ của mình và tham gia vào những hành vi mà nền tảng gọi là “hành vi kinh doanh trái pháp luật và không công bằng.” Vụ kiện, được nộp vào thứ Tư tại tòa liên bang, làm tăng căng thẳng về việc sử dụng nội dung web công khai để đào tạo các hệ thống AI thương mại.

Theo đơn kiện, Reddit cáo buộc rằng Anthropic đã truy cập và sử dụng một lượng lớn nội dung do người dùng tạo ra trên Reddit để đào tạo các mô hình AI của mình mà không có được các quyền hoặc giấy phép cần thiết. Nền tảng mạng xã hội này lập luận rằng hành động này không chỉ vi phạm chính sách của họ mà còn lợi dụng đóng góp của người dùng để kiếm lợi thương mại mà không có sự đồng ý.

Vụ kiện nhấn mạnh các câu hỏi rộng hơn về quyền sở hữu nội dung trực tuyến trong thời đại AI tạo sinh, và cách các công ty nên xử lý dữ liệu công khai mang theo các yếu tố về quyền riêng tư và niềm tin cộng đồng.

Thách thức pháp lý dựa trên việc sử dụng nội dung và lợi ích thương mại

Reddit khẳng định rằng Anthropic, mặc dù tự giới thiệu là một công ty AI có đạo đức, đã hành xử thiếu tôn trọng các quy định của nền tảng Reddit.

Trọng tâm của đơn kiện là cáo buộc rằng Anthropic đã đào tạo các mô hình AI — đặc biệt là Claude — dựa trên dữ liệu Reddit bị lấy trộm mà không có sự cho phép. Reddit chỉ ra rằng, khác với OpenAI và Google, đã ký các thỏa thuận cấp phép phù hợp với điều khoản của nền tảng và bảo vệ người dùng, Anthropic đã không đảm bảo được các quyền tương tự.

Sự khác biệt này có thể là yếu tố then chốt trong vụ kiện, đặc biệt khi các công ty AI ngày càng bị đặt dưới áp lực làm rõ cách họ thu thập và xử lý dữ liệu đào tạo, đặc biệt khi dữ liệu đó đến từ các nền tảng có nội dung do người dùng đóng góp.

Sự bùng nổ AI và căng thẳng giữa các nền tảng

Từ cuối năm 2022, AI tạo sinh đã thúc đẩy những chuyển biến lớn trong ngành công nghệ, với các nền tảng như Reddit trở thành kho chứa giá trị cao cho các insights, thảo luận và lời khuyên do con người tạo ra. Những đặc điểm này khiến chúng trở nên hấp dẫn đối với các nhà phát triển AI xây dựng các mô hình có khả năng hiểu biết và ngữ cảnh tốt hơn.

Reddit cũng đã tham gia vào nền kinh tế AI, gần đây công bố các hợp tác với OpenAI và Google cho phép các công ty này sử dụng nội dung Reddit theo các điều khoản cấp phép cụ thể. Các thỏa thuận này nhằm bảo vệ quyền riêng tư của người dùng trong khi vẫn tạo ra doanh thu từ 20 năm nội dung của nền tảng.

Tuy nhiên, theo đơn kiện, việc Anthropic sử dụng dữ liệu Reddit đã diễn ra mà không có các thỏa thuận như vậy. Nền tảng mạng xã hội này lập luận rằng điều này đã gây thiệt hại trực tiếp về tài chính và uy tín, do việc sử dụng dữ liệu trái phép để nâng cao sản phẩm của đối thủ.

Đội ngũ pháp lý của Reddit nhấn mạnh rằng việc tôn trọng các quy định của nền tảng là không thể bỏ qua, đặc biệt trong các lĩnh vực như fintech và AI, nơi sự minh bạch và tuân thủ ngày càng bị giám sát chặt chẽ từ phía người dùng và cơ quan quản lý.

Ảnh hưởng thị trường và phản ứng của ngành

Cổ phiếu của Reddit đã tăng hơn 6% vào thứ Tư sau khi công bố vụ kiện, cho thấy sự ủng hộ của các nhà đầu tư đối với quyết định bảo vệ quyền dữ liệu của công ty. Công ty, chính thức niêm yết vào đầu năm 2024, hiện có vốn hóa thị trường khoảng 22 tỷ USD.

Trong khi đó, Anthropic nhanh chóng trở thành một trong những startup được đầu tư nhiều nhất trong ngành AI. Công ty này được định giá 61,5 tỷ USD vào tháng 3, với sự hậu thuẫn từ các ông lớn như Amazon, Salesforce Ventures và Cisco Investments.

Mặc dù Anthropic đã tuyên bố không đồng ý với các cáo buộc của Reddit, kết quả của vụ kiện có thể ảnh hưởng lâu dài đến cách các công ty AI tiếp cận việc thu thập dữ liệu. Nó cũng có thể ảnh hưởng đến cách các nền tảng định giá hoặc hạn chế quyền truy cập vào nội dung của họ để đào tạo.

Các chuyên gia trong ngành nhận định rằng, mặc dù phát triển AI thường liên quan đến việc lấy dữ liệu từ các nguồn công khai, ranh giới giữa “công khai” và “có thể sử dụng thương mại” vẫn còn chưa rõ ràng. Các vụ kiện như thế này có thể thúc đẩy các khung pháp lý rõ ràng hơn nhằm cân bằng giữa đổi mới và đạo đức trong việc sử dụng nội dung.

Tăng cường chú trọng đạo đức dữ liệu trong AI

Hành động pháp lý của Reddit là một phần trong xu hướng rộng hơn khi các nền tảng bắt đầu phản kháng lại những gì họ xem là sự khai thác trái phép của các công ty AI. Khi ngày càng nhiều công ty công nghệ tìm cách kiếm tiền từ tài sản dữ liệu của mình, việc cấp phép nội dung đã trở thành một chiến trường.

Reddit đã rõ ràng trong đơn kiện rằng họ không phản đối việc sử dụng dữ liệu của mình trong đào tạo AI, mà chỉ phản đối việc sử dụng trái phép. Bằng cách phân biệt giữa các công ty tôn trọng điều khoản của mình — như OpenAI và Google — và những công ty bị cáo buộc không tuân thủ, Reddit muốn định vị mình là nền tảng thân thiện với AI và bảo vệ cộng đồng người dùng.

Trong đơn kiện, mối liên hệ giữa Reddit và CEO của OpenAI, Sam Altman, cựu thành viên hội đồng quản trị và cổ đông lớn, cũng được đề cập, làm phức tạp thêm bối cảnh của vụ kiện.

Chuyện gì sẽ xảy ra tiếp theo

Khi quá trình xét xử diễn ra, tất cả đều chú ý đến cách hệ thống pháp luật xử lý ranh giới mờ nhạt giữa nội dung internet mở và dữ liệu đào tạo sở hữu riêng. Vụ kiện này có thể tạo ra tiền lệ cho các tranh chấp trong tương lai giữa các nền tảng nội dung và các nhà phát triển AI.

Hiện tại, vụ kiện của Reddit góp phần gia tăng căng thẳng về cách các mô hình AI được đào tạo và mức độ mà các chủ sở hữu nền tảng có thể hoặc nên kiểm soát quyền truy cập vào dữ liệu do người dùng đóng góp.

Vụ kiện cũng nhấn mạnh rằng thời kỳ khai thác dữ liệu không có quy định rõ ràng có thể sắp kết thúc, đặc biệt khi nhận thức công chúng về quyền dữ liệu ngày càng tăng và các nền tảng muốn khẳng định quyền kiểm soát nhiều hơn đối với cách nội dung của họ được sử dụng trong các ứng dụng AI.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

2 thích