英伟达新一代GPU推理算力超越Blackwell五倍

英伟达宣布推出新一代GPU,其推理算力相较于Blackwell系列显卡大幅提升,性能提升幅度高达五倍,这一重大突破将极大加速人工智能应用的处理速度,提升用户体验和行业生产力水平,新一代GPU将为云计算、数据中心、游戏、虚拟现实等领域带来前所未有的性能提升和体验改善。

1月6日消息,theverge披露,英伟达首席执行官黄仁勋在ces 2026主旨演讲中正式宣布,“rubin”新一代计算架构平台已全面进入量产阶段。

英伟达新一代GPU推理算力超越Blackwell五倍

该平台涵盖六款全新芯片产品,包括Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9高速网卡、BlueField-4数据处理器(DPU)以及Spectrum-6以太网交换机。目前,全部六颗芯片已完成代工厂交付,并顺利通过多项核心验证测试,整体研发与量产节奏严格遵循既定时间表。

英伟达官宣新一代GPU 推理算力是Blackwell的5倍

根据英伟达官方发布的性能指标,Rubin平台在大模型训练效率上相较上一代Blackwell架构提升达3.5倍,AI软件运行效能增强5倍;推理环节的token生成成本最高可下降90%;训练混合专家(MoE)模型所需GPU数量亦缩减至Blackwell方案的四分之一。

全新Vera CPU搭载88个高性能内核,运算能力为同类竞品的两倍。这款处理器专为AI代理推理场景优化,被定位为超大规模AI基础设施中能效比最优的CPU方案,基于88个自研Olympus核心构建,完整兼容Armv9.2指令集,并集成高带宽NVLink-C2C片间互连技术。

Rubin GPU内置第三代Transformer引擎,支持硬件级自适应压缩加速,面向AI推理提供高达50 petaflops的NVFP4精度算力。单颗GPU内存带宽达3.6TB/s,而由其组成的Vera Rubin NVL72机架系统总带宽则跃升至260TB/s。

英伟达还确认,亚马逊AWS、谷歌云、微软Azure及甲骨文云等主流公有云厂商,将于2026年内率先上线基于Vera Rubin架构的云实例服务。与此同时,CoreWeave、Lambda、Nebius和Nscale等专业AI云服务商也将按计划陆续完成适配与部署。

英伟达官宣新一代GPU 推理算力是Blackwell的5倍

网友留言(0 条)

发表评论