🌕 Gate 广场 · 中秋创作激励限时开启!
创作点亮中秋,带热门话题发帖,瓜分 $5,000 中秋好礼!🎁
立即报名查看详情 👉 https://www.gate.com/campaigns/1953
💝 新用户首次发帖并完成互动任务,即可瓜分 $600 新人奖池!
🔥 今日热门话题: #我最看好的AI代币#
山寨季蓄势待发,AI板块代币普涨, #WLD# 、 #KAITO# 领涨,龙头 WLD 单日暴涨近48%,AI、IO、VIRTUAL 顺势跟上。近期你计划布局哪些潜力 AI 币?快来分享你的投资心得吧!
发帖建议:
1️⃣ AI 板块未来发展你怎么看?
2️⃣ 你最近看好哪些 AI 币向大家推荐?理由是什么?
3️⃣ 你最近的 AI 币种交易策略如何?
快带上 #我最看好的AI代币# 和 #Gate广场创作点亮中秋# 发帖,内容越多越优质,越有机会赢取 $5,000 中秋好礼!
字节跳动与浙大联合推多模态大语言模型 Vista-LLaMA,可解读视频内容
巴比特讯 字节跳动与浙江大学合作推出了多模态大语言模型 Vista-LLaMA,该模型专为视频内容理解而设计,能够输出高质量视频描述。通过创新的视觉与语言 token 处理方式,Vista-LLaMA 解决了在视频内容中出现“幻觉”现象的问题。
Vista-LLaMA 在多个开放式视频问答基准测试中表现卓越,尤其在 NExT-QA 和 MSRVTT-QA 测试中取得了突破性成绩。其在零样本 NExT-QA 测试中实现了 60.7% 的准确率,在 MSRVTT-QA 测试中达到了 60.5% 的准确率,超过了目前所有的 SOTA 方法。这些结果证明了 Vista-LLaMA 在视频内容理解和描述生成方面的高效性和精准性。