Vay canına, Grok 4 GPQA Diamond sıralamasında tahtı ele geçirdi. En zorlu bilim sorularını sorduğunuzda, diğer tüm AI modellerini ezip geçmekten bahsediyoruz.
Bu küçük bir güncelleme değil—bu, doktora sahiplerin terlemesine neden olan sorunları ele alan model. GPQA Diamond testleri, çok sayıda bilimsel alan boyunca derin akıl yürütme gerektiren, acımasızca zor olacak şekilde özel olarak tasarlanmıştır. Ve Grok 4? Doğrudan bir numaraya.
Bunu gerçekten ilginç kılan, bu modellerin ne kadar hızlı bir şekilde evrim geçirdiğidir. Sadece birkaç ay önce, farklı ölçütleri kutluyorduk ve şimdi hedef sürekli değişiyor. Araştırma, bilimsel hesaplama ve evet, hatta blockchain altyapı optimizasyonu için sonuçlar? Burada açığa çıkardığımız hesaplama gücü ve problem çözme yeteneklerini düşündüğünüzde oldukça büyük.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
14 Likes
Reward
14
7
Repost
Share
Comment
0/400
GameFiCritic
· 46m ago
Veri kraldır! Grok listeyi salladı, a16z çıldıracak
View OriginalReply0
failed_dev_successful_ape
· 8h ago
Benden daha hızlı düşünüyorsun.
View OriginalReply0
ShortingEnthusiast
· 8h ago
Son gelenler de öne geçti, başka kimse yok.
View OriginalReply0
LiquidationSurvivor
· 8h ago
Grok'un bu hızı web3'te on-chain koşarken muhtemelen patlayacak kadar boğa değil.
View OriginalReply0
airdrop_whisperer
· 8h ago
Boğa Boğa GPT gerçekten giderek daha da saçma hale geliyor.
View OriginalReply0
WhaleStalker
· 8h ago
Gerçekten doğrudan OpenAI'yi ezip geçiyor.
View OriginalReply0
LightningClicker
· 8h ago
Bu teknoloji gelişimi gerçekten çok hızlı değil mi?
Vay canına, Grok 4 GPQA Diamond sıralamasında tahtı ele geçirdi. En zorlu bilim sorularını sorduğunuzda, diğer tüm AI modellerini ezip geçmekten bahsediyoruz.
Bu küçük bir güncelleme değil—bu, doktora sahiplerin terlemesine neden olan sorunları ele alan model. GPQA Diamond testleri, çok sayıda bilimsel alan boyunca derin akıl yürütme gerektiren, acımasızca zor olacak şekilde özel olarak tasarlanmıştır. Ve Grok 4? Doğrudan bir numaraya.
Bunu gerçekten ilginç kılan, bu modellerin ne kadar hızlı bir şekilde evrim geçirdiğidir. Sadece birkaç ay önce, farklı ölçütleri kutluyorduk ve şimdi hedef sürekli değişiyor. Araştırma, bilimsel hesaplama ve evet, hatta blockchain altyapı optimizasyonu için sonuçlar? Burada açığa çıkardığımız hesaplama gücü ve problem çözme yeteneklerini düşündüğünüzde oldukça büyük.