快手推出全新可灵视频2.6,音画同出模型正式上线
快手推出首个音画同步模型“可灵视频 2.6”,实现了视频声音与画面的完美同步,这一创新技术为用户带来更加逼真的视听体验,提高了视频内容的互动性和观赏价值,该模型通过先进的算法技术,确保声音与画面高度匹配,为用户带来全新的视听感受,此举标志着快手在音视频技术方面取得重要进展,将推动短视频行业的创新发展。
快手可灵 ai 团队正式宣布,可灵视频全面升级至 2.6 版本,重磅推出革命性的「音画同出」功能,标志着可灵 ai 正式跨入“有声智能”新纪元。

据悉,这一全新模型彻底打破了以往 AI 视频制作中“先出画面、再配声音”的割裂式工作流。依托对现实世界中声音与动态影像之间深层语义关系的精准建模与联合理解,可灵 2.6 可在一次生成过程中,端到端输出兼具自然人声、精准动作音效及真实环境氛围音的完整音视频内容,真正实现“所见即所闻”的全感官沉浸体验。
可灵 2.6 开放两大高效创作模式:
- 文生音画:输入一句话,自动生成带声画同步的完整短视频;
- 图生音画:赋予静态图片以声音与动态表现力,让图像“开口说话、活起来”。


该模型强调“音与画由你一手掌控”,广泛适配多种内容场景,包括但不限于:
单人表达类(产品推介 / 日常 Vlog / 新闻播报 / 公开演讲)、
旁白叙述类(商品解说 / 体育赛事解说 / 人文纪录片 / 情节讲述)、
多人互动类(访谈对话 / 短剧演绎)、
以及音乐呈现类(演唱 / RAP表演 / 合唱编排 / 器乐演奏)等。
使用指南详见官方文档:https://www.php.cn/link/d817c023bf760228ebf536f68271bb90
源码获取地址:点击下载
下一篇 >>
网友留言(0 条)