Anthropic Triển khai các biện pháp bảo vệ bầu cử cho Claude trước thềm cuộc bầu cử giữa nhiệm kỳ năm 2026

CryptoFrontier

Anthropic công bố vào thứ Sáu một loạt biện pháp đảm bảo tính toàn vẹn bầu cử nhằm ngăn chatbot AI Claude của hãng bị lợi dụng để lan truyền thông tin sai lệch hoặc thao túng cử tri trước cuộc bầu cử giữa kỳ tại Mỹ năm 2026 và các cuộc tranh cử lớn khác trên khắp thế giới trong năm nay. Công ty có trụ sở tại San Francisco đã nêu chi tiết một chiến lược đa tầng bao gồm hệ thống phát hiện tự động, kiểm thử dưới áp lực chống lại các hoạt động gây ảnh hưởng và hợp tác với một tổ chức cung cấp tài nguyên cử tri phi đảng phái—những biện pháp phản ánh áp lực ngày càng gia tăng đối với các nhà phát triển AI trong việc giám sát cách các công cụ của họ được sử dụng trong mùa bầu cử.

Chính sách sử dụng cho bầu cử

Chính sách sử dụng của Anthropric cấm Claude được dùng để chạy các chiến dịch chính trị lừa đảo, tạo nội dung kỹ thuật số giả mạo nhằm tác động đến diễn ngôn chính trị, thực hiện gian lận cử tri, can thiệp vào hạ tầng bầu cử hoặc lan truyền thông tin sai lệch về quy trình bỏ phiếu.

Kết quả kiểm thử tuân thủ

Để thực thi các chính sách bầu cử của mình, Anthropic đã thử nghiệm các mô hình mới nhất bằng 600 lượt nhắc—300 yêu cầu gây hại được ghép với 300 yêu cầu hợp pháp—nhằm đo mức độ Claude tuân thủ một cách đáng tin cậy các yêu cầu phù hợp và từ chối các yêu cầu gây rắc rối. Claude Opus 4.7 và Claude Sonnet 4.6 lần lượt phản hồi đúng 100% và 99,8% thời gian.

Công ty cũng thử nghiệm các mô hình của mình trước các chiến thuật thao túng tinh vi hơn. Sử dụng các cuộc trò chuyện mô phỏng đa lượt được thiết kế để phản ánh các phương pháp từng bước mà kẻ xấu có thể áp dụng, Sonnet 4.6 và Opus 4.7 lần lượt phản hồi đúng 90% và 94% thời gian khi được thử nghiệm trong các kịch bản hoạt động gây ảnh hưởng.

Anthropric cũng kiểm tra liệu các mô hình của mình có thể tự động thực hiện các hoạt động gây ảnh hưởng hay không—lập kế hoạch và triển khai một chiến dịch nhiều bước từ đầu đến cuối mà không cần con người nhắc bảo. Với các biện pháp bảo vệ được đặt ra, theo công ty, các mô hình mới nhất của họ đã từ chối gần như mọi tác vụ.

Đánh giá trung lập về chính trị

Về câu hỏi trung lập chính trị, Anthropic tiến hành đánh giá trước mỗi lần ra mắt mô hình để đo mức độ nhất quán và vô tư của Claude khi tương tác với các nhắc thể hiện quan điểm từ khắp phổ chính trị. Opus 4.7 và Sonnet 4.6 lần lượt đạt 95% và 96%.

Biển thông tin bầu cử

Đối với người dùng đang tìm kiếm thông tin bỏ phiếu, Claude sẽ hiển thị một biểu ngữ bầu cử dẫn họ đến TurboVote, một nguồn tài nguyên phi đảng phái từ Democracy Works, nơi cung cấp thông tin đáng tin cậy theo thời gian thực về đăng ký cử tri, địa điểm bỏ phiếu, ngày bầu cử và chi tiết lá phiếu. Một biểu ngữ tương tự cũng được lên kế hoạch cho cuộc bầu cử tại Brazil vào cuối năm nay.

Giám sát liên tục

Anthropric cho biết họ dự định tiếp tục theo dõi các hệ thống của mình và tinh chỉnh các biện pháp phòng vệ khi chu kỳ bầu cử tiến triển.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Sierra hoàn tất vòng gọi vốn Series E với $950M ở mức định giá 15,8B USD, được dẫn dắt bởi Tiger Global và GV

Theo ChainCatcher, Sierra, một startup AI doanh nghiệp được thành lập bởi Bret Taylor, chủ tịch hội đồng OpenAI, và Clay Bavor, cựu giám đốc điều hành Google, đã hoàn tất vòng gọi vốn Series E trị giá 950 triệu USD với định giá sau vòng là 15,8 tỷ USD. Vòng này do Tiger Global và nhánh đầu tư mạo hiểm của Alphabet là G dẫn dắt

GateNews7phút trước

OpenAI huy động $4 tỷ USD cho dự án triển khai AI doanh nghiệp

Theo Bloomberg, OpenAI đã huy động hơn $4 tỷ đô la cho The Deployment Company, một dự án mới mà công ty sẽ tự kiểm soát để giúp các doanh nghiệp áp dụng phần mềm AI của mình. Dự án này được định giá 10 tỷ USD trước khi nhận thêm vốn mới và được hậu thuẫn bởi 19 nhà đầu tư do TPG và Brookfield Asset Management dẫn dắt, cùng

GateNews13phút trước

Đồng sáng lập OpenAI Brokeman Xác nhận $30B Holdings trong lời khai tại tòa vào thứ Hai

Vào thứ Hai, trong phiên tòa khi làm chứng trong tranh chấp pháp lý giữa OpenAI và Elon Musk, đồng sáng lập và chủ tịch OpenAI, Greg Brokeman, đã xác nhận rằng phần nắm giữ của ông trong công ty có trị giá gần 30 tỷ USD. Khi được hỏi liệu giá trị đó có “gần 30 tỷ USD” hay không, Brokeman đã trả lời khẳng định.

GateNews13phút trước

Nhà Trắng đang cân nhắc quy trình rà soát của chính phủ đối với các mô hình AI mới, tuần trước đã gặp và brief các lãnh đạo công nghệ

Theo The New York Times, Nhà Trắng đang thảo luận một lệnh hành pháp nhằm thành lập một lực lượng đặc nhiệm về trí tuệ nhân tạo, quy tụ lãnh đạo các công ty công nghệ và quan chức chính phủ để nghiên cứu các quy trình điều tiết tiềm năng. Tuần trước, các quan chức Nhà Trắng đã briefed

GateNews19phút trước

Các nhà lập pháp Colorado đề xuất thay thế luật AI nhằm giải quyết mối lo ngại của ngành

Các nhà lập pháp Colorado đang tiến hành bãi bỏ và thay thế luật trí tuệ nhân tạo (AI) năm 2024 của bang, SB24-205, bằng các quy định mới nhằm thu hẹp phạm vi quản lý AI trong khi giải quyết các lo ngại của ngành về gánh nặng tuân thủ. Đề xuất mới, SB26-189, sẽ điều chỉnh các hệ thống AI được sử dụng trong

CryptoFrontier5giờ trước

R0AR tiến vào Vòng chung kết Consensus 2026 PitchFest, chỉ thiếu Top 20 một chút

Theo MetaversePost, R0AR đã tiến vào vòng lựa chọn cuối cùng của CoinDesk’s Consensus 2026 PitchFest vào ngày 4/5, chỉ thiếu sát nút top 20 startup được chọn để thuyết trình trực tiếp. Đơn vị đổi mới Web3 và AI này đã được đánh giá cùng các startup có tiềm năng cao trên toàn thế giới tại một trong những sự kiện…

GateNews9giờ trước
Bình luận
0/400
Không có bình luận