Qwen3-Omni即将亮相，端侧跨模态模型再升级，已提交至Transformers库的PR

2026-01-09/ 19 次浏览/ 资讯

Qwen3-Omni即将发布，这是端侧跨模态模型的最新升级，该模型已经提交了PR至Transformers库，这一升级将带来显著的性能提升和更广泛的应用场景，有望引领人工智能领域的新一轮技术革新，摘要字数在100-200字之间。

阿里云今日正式发布并开源了其全新的 qwen3-omni、qwen3-tts，以及对标谷歌 nano banana 图像编辑工具的 qwen-image-edit-2509。

Qwen3-Omni 即将登场:端侧跨模态模型再升级，PR 已提交 Transformers 库

其中，Qwen3-Omni 作为业界首个原生端到端全模态 AI 模型，能够同时处理文本、图像、音频和视频等多种输入类型，并支持通过文本或自然语音进行实时流式输出，有效解决了传统多模态模型在不同能力间难以兼顾的难题。该模型基于“思考者–表达者”双轨架构设计，结合 MoE（专家混合）结构与 AuT 预训练机制，实现高效的跨模态理解与低延迟交互，适用于复杂的多模态任务和实时对话场景。

关键词：谷歌工具阿里云 ai qwen

<< 上一篇

美图秀秀发布AI智能助手新功能

下一篇 >>

英伟达与英特尔联手重塑AI格局，50亿美元入股开启合作新篇章

Qwen3-Omni即将亮相，端侧跨模态模型再升级，已提交至Transformers库的PR

网友留言（0 条）

发表评论

Qwen3-Omni即将亮相，端侧跨模态模型再升级，已提交至Transformers库的PR

相关文章

网友留言（0 条）

发表评论