08:34
Согласно отчету журнала Science and Technology Innovation Board Daily от 14 сентября, на Глобальном саммите AI Chip Summit 2023 технический директор NVIDIA по решениям и архитектуре Чжан Жуйхуа представила новейшее программное обеспечение NVIDIA с открытым исходным кодом TensorRT-LLM. Она сказала, что TensorRT-LLM может в основном решать проблемы текущая проблема. Проблемы включают быструю разработку моделей, частые обновления и большое количество пользователей. Программное обеспечение поддерживает несколько узлов графического процессора и просто в программировании. В сочетании с Triton оно может уменьшить проблемы с задержкой многопользовательской работы, тем самым полностью используя GPU и снижение затрат. Для обучения больших моделей NVIDIA также предложила NeMo Framework, которая представляет собой комплексную облачную среду обучения для создания, настройки и развертывания генеративных моделей ИИ, охватывающую, по сути, весь жизненный цикл обучения больших моделей. . Чтобы предотвратить тарабарщину больших моделей, NVIDIA также предоставляет функцию ограждения безопасности (Guardrails), которая помогает большим моделям лучше обобщать знания. Чжан Жуйхуа считает, что модели искусственного интеллекта имеют огромное пользовательское пространство. В будущем они будут существовать не только в исследовательских институтах, но могут стать приложениями на мобильных телефонах и компьютерах каждого.
- 1








