Kami sangat senang untuk membagikan hasil kolaborasi kami dengan SGLang. 🎉



Bersama-sama, kami mengoptimalkan inferensi DeepSeek R1 untuk penyebaran di GB200 NVL72—memberikan peningkatan 2x dan 3x per GPU dibandingkan dengan kluster H100 yang hampir dua kali lipat ukuran.

Inilah seperti apa inferensi MoE perbatasan.
DEEPSEEK-2.06%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 6
  • Bagikan
Komentar
0/400
WhaleWatchervip
· 17jam yang lalu
Kinerja meningkat dua kali lipat, luar biasa!
Lihat AsliBalas0
Rugpull幸存者vip
· 17jam yang lalu
Jadi, kamu sedang membahas performa lagi, ya?
Lihat AsliBalas0
OnChainDetectivevip
· 17jam yang lalu
hmm melacak metrik gpu itu... ada yang tidak sesuai di sini
Lihat AsliBalas0
MetaverseVagabondvip
· 17jam yang lalu
Wah, akhirnya bisa mengalahkan H100!
Lihat AsliBalas0
ClassicDumpstervip
· 17jam yang lalu
又跟着To da moon了吧
Lihat AsliBalas0
WhaleMinionvip
· 17jam yang lalu
Kinerja GPU meledak.
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)