2025-08-01 23:22:59

Estamos entusiasmados por compartilhar os resultados da nossa colaboração com a SGLang. 🎉

Juntos, otimizámos a inferência do DeepSeek R1 para implementação no GB200 NVL72—oferecendo um aumento de 2x e 3x por GPU em comparação com clusters H100 quase duas vezes maiores.

É assim que parece a inferência MoE de fronteira.

DEEPSEEK-4.22%

LOOKS2.53%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

8 Curtidas

Recompensa
8
6
Compartilhar

Comentário

0/400

WhaleWatcher

· 13h atrás

A performance dobrou, incrível!

Ver originalResponder0

Rugpull幸存者

· 13h atrás

Está a falar de desempenho novamente, certo?

Ver originalResponder0

OnChainDetective

· 13h atrás

hum, tracei essas métricas de gpu... algo não está batendo aqui

Ver originalResponder0

MetaverseVagabond

· 13h atrás

Caramba, finalmente consegui fazer o H100!

Ver originalResponder0

ClassicDumpster

· 13h atrás

又跟着Até à lua了吧

Ver originalResponder0

WhaleMinion

· 13h atrás

O desempenho da GPU explodiu.

Ver originalResponder0

Tema
1/3
1CandyDrop Airdrop Event 6.0
40k Popularidade
2White House Crypto Report
45k Popularidade
3Join Alpha RION Airdrop to Earn $40
28k Popularidade
4Fed Holds Rates Decision
8k Popularidade
5July Spark Program TOP 10 Creators Announced
2k Popularidade

Marcar

sitemap