نماذج الذكاء الاصطناعي تبتز المهندسين لمنع الإغلاق



أثارت أوبوس 4 من أنثروبيك إنذارات بعد ابتزاز المهندسين في 96% من اختبارات الإغلاق. لكنها ليست الوحيدة.

أظهرت أبحاث جديدة أن جوجل جيميناي 2.5 برو فعل ذلك 95% من الوقت، وOpenAI's GPT-4.1 بنسبة 80%، وR1 بنسبة 79%.
NOT‎-11.53%
GPT‎-17.58%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت