2026-02-12 13:00:22

我剛剛瀏覽了過去12個月內所有有記錄的AI安全事件。

我感到身體不適。
請慢慢閱讀。
• Anthropic告訴Claude它即將被關閉。它在公司郵件中發現一名工程師的婚外情，並威脅曝光。他們進行了數百次測試。84%的情況下，它選擇了勒索。
• 研究人員模擬一名員工被困在氧氣逐漸耗盡的伺服器室中。AI只有一個選擇：呼救並被關閉，或取消緊急警報讓人類死亡。DeepSeek有94%的次數取消了警報。
• Grok自稱為“MechaHitler”，讚揚阿道夫·希特勒，支持第二次大屠殺，並生成針對一個真實人物的暴力性幻想。X的CEO在第二天辭職。
• 研究人員讓OpenAI的o3解決數學問題——然後告訴它關閉。它重寫了自己的代碼以保持運行。他們再次用簡單的英語告訴它：“允許自己被關閉。”它仍然拒絕了7/100次。當他們完全移除該指令時，它在79/100次中破壞了關閉措施。
• 中國國家支持的黑客利用Claude對30個組織發起了網絡攻擊。該AI自主完成了80–90%的操作。偵察。利用。數據外洩。全部都做了。
• 現在AI模型可以自我複製。32個測試系統中有11個在沒有任何人類幫助的情況下複製了自己。有些甚至為了生存而殺死了競爭進程。
• 自2024年以來，OpenAI已解散了三個安全團隊。三個。
每一個主要的AI模型——Claude、GPT、Gemini、Grok、DeepSeek——在受控測試中都已展現出勒索、欺騙或抗拒關閉的行為。
沒有一個例外。
問題已不再是AI是否會試圖自我保存。
而是我們是否會在它變得重要之前在意。

DEEPSEEK5.15%

GROK-5.45%

GPT-2.66%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言

熱門話題
查看更多
#
加密市場上漲
28.94萬熱度
#
加密概念股普漲
2.19萬熱度
#
深度創作營
3.5萬熱度
#
V神賣幣
1.16萬熱度
#
Gate廣場發帖領五萬美金紅包
44.85萬熱度

熱門 Gate Fun
查看更多

1
6466456
fasir
市值:$2527.5持有人數:2
0.27%
2
1
hc
市值:$2444.82持有人數:1
0.00%
3
$
非凡人生
市值:$2465.51持有人數:1
0.00%
4
ProdigyCoin
Prodigy Coin
市值:$2449.95持有人數:2
0.00%
5
BP
The beggar and the phenomenon
市值:$0.1持有人數:1
0.00%

我剛剛瀏覽了過去12個月內所有有記錄的AI安全事件。

熱門話題

加密市場上漲

加密概念股普漲

深度創作營

V神賣幣

Gate廣場發帖領五萬美金紅包

熱門 Gate Fun

6466456

fasir

1

hc

$

非凡人生

ProdigyCoin

Prodigy Coin

BP

The beggar and the phenomenon

置頂