英伟达开源DAM模型,图像视频描述技术登顶SOTA,AI生态再下一城
2025-04-25
英伟达联合UC伯克利等机构开源了多模态大模型DAM(Describe Anything Model),该模型可精准描述图像或视频中指定区域的细节。用户通过点选、框选等方式定位区域后,DAM能生成包含颜色、纹理、动态动作等丰富信息的描述,并支持视频跨帧跟踪。在7个基准测试中达成了SOTA(最优效果),尤其在局部描述准确性和细节捕捉上超越现有模型30%以上。该模型已开放演示,可直接应用于内容生成、视频分析等场景。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
