Selon un rapport du Science and Technology Innovation Board Daily du 14 septembre, lors du Global AI Chip Summit 2023, Zhang Ruihua, directrice technique des solutions et de l'architecture de NVIDIA, a présenté le dernier logiciel open source de NVIDIA, TensorRT-LLM. Elle a déclaré que TensorRT-LLM peut essentiellement résoudre résoudre le problème actuel. Les défis incluent le développement rapide de modèles, les mises à jour fréquentes et un grand nombre d'utilisateurs. Le logiciel prend en charge plusieurs nœuds GPU et est simple à programmer. Associé à Triton, il peut réduire les problèmes de latence multi-utilisateurs, exploitant ainsi pleinement le GPU et réduction des coûts. Pour la formation de grands modèles, NVIDIA a également proposé le NeMo Framework, qui est un cadre de formation de bout en bout et natif du cloud pour la construction, la personnalisation et le déploiement de modèles d'IA génératifs, couvrant essentiellement l'ensemble du cycle de vie de la formation de grands modèles. . Afin d'éviter le baragouin des grands modèles, NVIDIA propose également une fonction de garde-corps de sécurité (Guardrails) pour aider les grands modèles à mieux généraliser les connaissances. Zhang Ruihua estime que les modèles d'IA disposent d'un immense espace d'utilisation : à l'avenir, ils n'existeront pas seulement dans les instituts de recherche, mais pourraient devenir des applications sur les téléphones portables ou les ordinateurs de chacun.