阿里开源7B全模态大模型,语音技术应用迎来新爆发
2025-03-27
阿里开源7B端到端全模态大模型Qwen2.5-Omni,支持文本、音频、图像、视频等多模态处理,语音合成能力达到人类水平。该模型轻量化设计适合手机等终端部署,采用Thinker-Talker双核架构,可实时生成语音和文本,开发者可免费商用。已吸引超90%国产手机品牌接入,苹果合作或推动其在iPhone应用。技术突破覆盖语音识别、翻译、音视频情绪理解等核心领域,多模态性能超谷歌同类模型。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
