Vay canına, Grok 4 GPQA Diamond sıralamasında tahtı ele geçirdi. En zorlu bilim sorularını sorduğunuzda, diğer tüm AI modellerini ezip geçmekten bahsediyoruz.

Bu küçük bir güncelleme değil—bu, doktora sahiplerin terlemesine neden olan sorunları ele alan model. GPQA Diamond testleri, çok sayıda bilimsel alan boyunca derin akıl yürütme gerektiren, acımasızca zor olacak şekilde özel olarak tasarlanmıştır. Ve Grok 4? Doğrudan bir numaraya.

Bunu gerçekten ilginç kılan, bu modellerin ne kadar hızlı bir şekilde evrim geçirdiğidir. Sadece birkaç ay önce, farklı ölçütleri kutluyorduk ve şimdi hedef sürekli değişiyor. Araştırma, bilimsel hesaplama ve evet, hatta blockchain altyapı optimizasyonu için sonuçlar? Burada açığa çıkardığımız hesaplama gücü ve problem çözme yeteneklerini düşündüğünüzde oldukça büyük.

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

14 Likes