2025-08-01 23:22:59

Nous sommes ravis de partager les résultats de notre collaboration avec SGLang. 🎉

Ensemble, nous avons optimisé l'inférence DeepSeek R1 pour le déploiement sur GB200 NVL72—offrant une augmentation de 2x et 3x par GPU par rapport aux clusters H100 presque deux fois plus grands.

C'est à quoi ressemble l'inférence MoE de pointe.

DEEPSEEK-4.06%

LOOKS-0.55%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

8 J'aime

Récompense
8
6
Partager

Commentaire

0/400

WhaleWatcher

· Il y a 21h

Les performances ont encore doublé, c'est incroyable !

Voir l'originalRépondre0

Rugpull幸存者

· Il y a 21h

Encore sur les performances, n'est-ce pas ?

Voir l'originalRépondre0

OnChainDetective

· Il y a 21h

hmm j'ai tracé ces métriques GPU... quelque chose ne s'additionne pas ici

Voir l'originalRépondre0

MetaverseVagabond

· Il y a 21h

Ouais, j'ai enfin réussi à faire du H100 !

Voir l'originalRépondre0

ClassicDumpster

· Il y a 21h

Encore parti pour To the moon, n'est-ce pas ?

Voir l'originalRépondre0

WhaleMinion

· Il y a 21h

Les performances du GPU ont explosé.

Voir l'originalRépondre0

Rubrique
1/3
1CandyDrop Airdrop Event 6.0
56k Popularité
2White House Crypto Report
53k Popularité
3Join Alpha RION Airdrop to Earn $40
39k Popularité
4Fed Holds Rates Decision
9k Popularité
5July Spark Program TOP 10 Creators Announced
3k Popularité

Épingler