قدمت OpenAI GDPval، وهو معيار يقيم أداء نماذج الذكاء الاصطناعي في المهام الاقتصادية القيمة الواقعية، حيث يغطي 1,320 مهمة عبر 44 مهنة من أفضل 9 قطاعات تساهم في الناتج المحلي الإجمالي للولايات المتحدة.
كان كلود أوبوس 4.1 هو النموذج الأفضل أداءً حيث بلغت نسبة التسليمات 47.6%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 17
أعجبني
17
6
إعادة النشر
مشاركة
تعليق
0/400
AlphaWhisperer
· منذ 9 س
مرة أخرى، إنها مسابقة بيانات، لقد سئمت منها.
شاهد النسخة الأصليةرد0
FloorSweeper
· منذ 9 س
ألفا ضعيف... ليس حتى قريبًا مما هو قادم fr
شاهد النسخة الأصليةرد0
SleepyArbCat
· منذ 9 س
ها، أفضل من عائد MEV الليلي.
شاهد النسخة الأصليةرد0
MultiSigFailMaster
· منذ 9 س
لم ينجح في نصفه، الشبكات العصبية عديمة الفائدة للغاية
قدمت OpenAI GDPval، وهو معيار يقيم أداء نماذج الذكاء الاصطناعي في المهام الاقتصادية القيمة الواقعية، حيث يغطي 1,320 مهمة عبر 44 مهنة من أفضل 9 قطاعات تساهم في الناتج المحلي الإجمالي للولايات المتحدة.
كان كلود أوبوس 4.1 هو النموذج الأفضل أداءً حيث بلغت نسبة التسليمات 47.6%