Grok 性能里程碑達成



近期的基準評估顯示在多個 AI 評估框架中取得了重大成就。該模型目前在 OpenRouter 排行榜中名列前茅,處理約 4890 億個標記,類別佔比達 31.2%,並在語言專用基準中處理 1160 億個標記。

這些結果不僅僅是一般排名——該系統還在 Kilo Code 和 Roo Code 排行榜上分別獲得第一名,這些是專為評估代碼生成和推理能力而設的專門環境。EQ-Bench3 評估進一步證實了其先進的性能指標,展現出在多樣的技術評估方法中持續的卓越表現。

累積數據顯示模型在效率、標記處理優化和跨領域能力開發方面取得了實質性進步。這些進展對於將 AI 解決方案整合到區塊鏈應用和去中心化系統的開發者來說尤為重要,因為計算可靠性和性能一致性直接影響用戶體驗和平台擴展性。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 4
  • 轉發
  • 分享
留言
0/400
链上小透明vip
· 17小時前
grok這成績是真不錯啊,不過排行榜這東西說實話得看它什麼時候翻車,之前那些號稱第一的模型後來怎麼樣了啦
查看原文回復0
NFTRegrettervip
· 12-27 21:45
又被Grok的benchmark吊打了,這數字真的撐不住了
查看原文回復0
WalletDetectivevip
· 12-27 21:40
grok又卷起來了,這數據看著倒是嚇人...489B tokens什麼的,反正我是看不懂,但排名第一這事兒還是值得留意的
查看原文回復0
智能合约捉虫人vip
· 12-27 21:40
grok又在刷榜啊...489B tokens這數字聽著就離譜,真的假的?
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)