Estamos emocionados de compartir los resultados de nuestra colaboración con SGLang. 🎉



Juntos, optimizamos la inferencia de DeepSeek R1 para su implementación en GB200 NVL72, logrando un aumento de 2x y 3x por GPU en comparación con clústeres H100 casi del doble de tamaño.

Esto es cómo se ve la inferencia de MoE en la frontera.
DEEPSEEK-3.36%
LOOKS-0.24%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Compartir
Comentar
0/400
WhaleWatchervip
· hace21h
¡El rendimiento se ha duplicado, increíble!
Ver originalesResponder0
Rugpull幸存者vip
· hace21h
¿Está de nuevo en la mejora del rendimiento, verdad?
Ver originalesResponder0
OnChainDetectivevip
· hace21h
hmm rastreé esas métricas de gpu... algo no cuadra aquí
Ver originalesResponder0
MetaverseVagabondvip
· hace21h
¡Por fin he superado el H100!
Ver originalesResponder0
ClassicDumpstervip
· hace22h
Otra vez se fue a la luna, ¿verdad?
Ver originalesResponder0
WhaleMinionvip
· hace22h
El rendimiento de la GPU ha explotado.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)