Según un informe del Science and Technology Innovation Board Daily del 14 de septiembre, en la Cumbre Mundial de Chips de IA de 2023, el Director Técnico de Arquitectura y Soluciones de NVIDIA, Zhang Ruihua, presentó el último software de código abierto de NVIDIA, TensorRT-LLM, y dijo que TensorRT-LLM básicamente puede resolver El problema actual. Los desafíos incluyen el desarrollo rápido de modelos, actualizaciones frecuentes y una gran cantidad de usuarios. El software admite múltiples nodos de GPU y es fácil de programar. Combinado con Triton, puede reducir los problemas de latencia multiusuario, aprovechando así al máximo el GPU y reducción de costes. Para el entrenamiento de modelos grandes, NVIDIA también propuso NeMo Framework, que es un marco de entrenamiento nativo de la nube y de extremo a extremo para construir, personalizar e implementar modelos de IA generativos, que básicamente cubre todo el ciclo de vida del entrenamiento de modelos grandes. . Para evitar que los modelos grandes farfullen, NVIDIA también proporciona una función de barandilla de seguridad (Guardrails) para ayudar a los modelos grandes a generalizar mejor el conocimiento. Zhang Ruihua cree que los modelos de IA tienen un enorme espacio de uso y que en el futuro no sólo existirán en los institutos de investigación, sino que también podrán convertirse en aplicaciones en los teléfonos móviles o ordenadores de todo el mundo.