微软将自研图像生成模型整合至Bing与Copilot，引领视觉智能新时代

2026-01-09/ 22 次浏览/ 资讯

mai-image-1 是微软完全自主研发的首款文本生成图像（text-to-image）模型。近期，官方宣布该模型已正式集成至部分微软产品中，如 bing image creator 以及 copilot audio expressions（用于为故事模式音频生成个性化封面图）。

https://www.php.cn/link/853db3a86b5017a2fcea7e7f720c734chttps://www.php.cn/link/b5bf79061d232cfe39e740c80cf8d4f1

据微软 AI 部门负责人 Mustafa Suleyman 表示，MAI-Image-1 在生成食物图像、自然风光、具有艺术感的光影效果以及高度写实的细节方面“展现出卓越能力”。

微软将自研图像生成模型 MAI-Image-1 整合至 Bing、Copilot

据悉，MAI-Image-1 模型专为创意应用场景优化设计。微软在训练过程中特别注重避免“重复性输出”或“过度风格化”的问题，并积极征求了艺术家、设计师等创意领域专业人士的意见与反馈，使其能够生成多样化的视觉内容，尤其在食物、自然场景以及融合“艺术化光线与摄影级真实细节”的图像生成上表现突出。

<< 上一篇

下一篇 >>