生数科技与清华联合发布开源视频生成加速框架TurboDiffusion

生数科技与清华大学合作,共同发布并开源了一个视频生成加速框架,名为TurboDiffusion,这一技术旨在提高视频生成的速度和效率,为开发者提供更加便捷的视频处理工具,通过联合研究和开发,TurboDiffusion框架能够帮助用户快速生成高质量的视频内容,推动视频生成技术的发展,该框架的开源性质也促进了技术的共享和进步,为行业内的创新提供了更多可能性。

近日,生数科技携手清华大学 tsail 实验室共同推出并开源一款面向视频生成任务的高效推理加速框架——turbodiffusion。

生数科技与清华联合发布开源视频生成加速框架TurboDiffusion

开源地址:https://www.php.cn/link/5cefe77fe6363fc905997de406a0cd1e

官方信息显示,在几乎不牺牲视觉保真度与内容连贯性的前提下,该框架可达成最高达200倍的视频生成推理速度提升。TurboDiffusion 的核心技术突破,精准切中当前视频生成技术演进的关键瓶颈。尽管扩散模型在视频创作领域展现出卓越的表征与生成能力,但长期受限于高昂的计算开销与缓慢的推理节奏。

生数科技联合清华发布并开源视频生成加速框架 TurboDiffusion

生数科技联合清华发布并开源视频生成加速框架 TurboDiffusion

区别于传统单点性能调优路径,TurboDiffusion 采用多维度协同优化策略,深度重构了模型的计算范式、注意力机制设计及端到端推理流程,实现对视频生成全链路的系统性提效。

TurboDiffusion 并非依赖某一项孤立技术,而是融合多项前沿加速方法,形成一套有机集成的技术体系:

  • 低比特注意力加速:引入 SageAttention 技术,将注意力运算迁移至低精度 Tensor Core 上执行,在零精度损失的前提下,实现注意力模块数倍级提速。
  • 稀疏-线性注意力加速:集成可学习稀疏注意力机制 Sparse-Linear Attention(SLA),在 SageAttention 基础上进一步压缩注意力计算量,稀疏加速比最高可达 17–20 倍。
  • 采样步数蒸馏加速:采用当前最先进的 rCM 蒸馏方案,使模型仅需 3–4 步即可输出高保真视频,显著缩短生成周期。
  • 线性层量化加速:对模型中所有线性层的权重与激活值统一实施 8 比特块量化(128×128 粒度),即 W8A8 量化方案,既加快线性计算,又大幅降低显存占用。

TurboDiffusion 的面世,首次在维持专业级生成质量的同时,将视频生成耗时压缩至接近实时交互的水平,被业界视为视频大模型发展进程中的“DeepSeek Moment”。它正加速推动整个行业由早期技术验证阶段,迈入规模化部署与商业化应用的新纪元,也标志着 AI 视频内容生产正式步入“实时生成”时代。

参考链接:
TurboDiffusion:https://www.php.cn/link/5cefe77fe6363fc905997de406a0cd1e
SageAttention:https://www.php.cn/link/b0263bc40e0ff50f481b85a968c30ac1
Sparse-Linear Attention:https://www.php.cn/link/ee04d7461f4c27af47fb49708e132073
SLArCM:https://www.php.cn/link/bb5acdd12f1b38cff9b475186aadd33d

源码地址:点击下载

网友留言(0 条)

发表评论