قدمت OpenAI GDPval، وهو معيار يقيم أداء نماذج الذكاء الاصطناعي في المهام الاقتصادية القيمة الواقعية، حيث يغطي 1,320 مهمة عبر 44 مهنة من أفضل 9 قطاعات تساهم في الناتج المحلي الإجمالي للولايات المتحدة.
كان كلود أوبوس 4.1 هو النموذج الأفضل أداءً حيث بلغت نسبة التسليمات 47.6%
شاهد النسخة الأصلية