英伟达发布DAM-3B模型:AI视觉描述技术再突破
2025-04-24
英伟达推出DAM-3B模型,专注图像和视频局部细节的精准描述,支持点选、框选等交互方式,并开源视频分析版本DAM-3B-Video。该模型采用创新架构,通过焦点提示和局部视觉骨干网络提升细节捕捉能力,构建150万样本数据集,测试准确率超GPT-4o,应用场景涵盖无障碍工具、机器人及视频分析等领域。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
