阿里开源全模态模型Qwen2.5-Omni，7B尺寸实现全球最强性能

2个月前发布 liudada

阿里通义千问Qwen2.5-Omni-7B正式开源。作为首个端到端全模态大模型，Qwen2.5-Omni可同时处理文本、图像、音频和视频输入，实时生成文本与自然语音输出。在OmniBench等多模态任务中刷新纪录，性能远超Google的Gemini-1.5-Pro等同类模型。

文章版权归作者所有，未经允许请勿转载。

没有相关内容!