微软将自研图像生成模型整合至Bing与Copilot,引领视觉智能新时代
mai-image-1 是微软完全自主研发的首款文本生成图像(text-to-image)模型。近期,官方宣布该模型已正式集成至部分微软产品中,如 bing image creator 以及 copilot audio expressions(用于为故事模式音频生成个性化封面图)。

https://www.php.cn/link/853db3a86b5017a2fcea7e7f720c734chttps://www.php.cn/link/b5bf79061d232cfe39e740c80cf8d4f1
据微软 AI 部门负责人 Mustafa Suleyman 表示,MAI-Image-1 在生成食物图像、自然风光、具有艺术感的光影效果以及高度写实的细节方面“展现出卓越能力”。

据悉,MAI-Image-1 模型专为创意应用场景优化设计。微软在训练过程中特别注重避免“重复性输出”或“过度风格化”的问题,并积极征求了艺术家、设计师等创意领域专业人士的意见与反馈,使其能够生成多样化的视觉内容,尤其在食物、自然场景以及融合“艺术化光线与摄影级真实细节”的图像生成上表现突出。
<< 上一篇
网友留言(0 条)