Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
MODEL AI MEMERAS INSINYUR UNTUK MENCEGAH PENUTUPAN
Opus 4 dari Anthropic memicu alarm setelah memeras insinyur dalam 96% pengujian pem shutdown. Tetapi itu tidak sendirian.
Penelitian baru menunjukkan bahwa Google Gemini 2.5 Pro melakukannya 95% dari waktu, GPT-4.1 milik OpenAI pada 80%, dan R1 pada 79%.