Qwen3-Omni即将亮相,端侧跨模态模型再升级,已提交至Transformers库的PR

Qwen3-Omni即将发布,这是端侧跨模态模型的最新升级,该模型已经提交了PR至Transformers库,这一升级将带来显著的性能提升和更广泛的应用场景,有望引领人工智能领域的新一轮技术革新,摘要字数在100-200字之间。

阿里云今日正式发布并开源了其全新的 qwen3-omni、qwen3-tts,以及对标谷歌 nano banana 图像编辑工具的 qwen-image-edit-2509。

Qwen3-Omni即将亮相,端侧跨模态模型再升级,已提交至Transformers库的PR

 Qwen3-Omni 即将登场:端侧跨模态模型再升级,PR 已提交 Transformers 库

其中,Qwen3-Omni 作为业界首个原生端到端全模态 AI 模型,能够同时处理文本、图像、音频和视频等多种输入类型,并支持通过文本或自然语音进行实时流式输出,有效解决了传统多模态模型在不同能力间难以兼顾的难题。该模型基于“思考者–表达者”双轨架构设计,结合 MoE(专家混合)结构与 AuT 预训练机制,实现高效的跨模态理解与低延迟交互,适用于复杂的多模态任务和实时对话场景。

网友留言(0 条)

发表评论