NVIDIA发布全新GPU Rubin CPX,高达百万token推理性能,配备高达128GB显存重磅来袭!

NVIDIA宣布推出全新GPU——Rubin CPX,配备高达128GB显存,拥有出色的推理性能,可处理高达百万级别的token,这款GPU将为专业用户和高性能计算领域带来显著的性能提升,助力推动人工智能、机器学习等领域的快速发展。

9月10日消息,传闻中的128gb显存rtx 5090并不存在。不过,nvidia确实推出了一款配备128gb显存的ai专用gpu。

NVIDIA发布全新GPU Rubin CPX,高达百万token推理性能,配备高达128GB显存重磅来袭!

据悉,NVIDIA下一代GPU架构代号为“Rubin”,预计将于明年正式亮相。

但就在今日,NVIDIA官方发布了“Rubin CPX”——这是一款专为长窗口AI推理和智能体工作负载设计的上下文处理GPU。

该产品基于全新的Rubin架构打造,采用单芯片方案。虽然CUDA核心数量尚未公布,但它配备了四个NVENC编码器和四个NVDEC解码器,以优化视频处理流程,并搭载了高达128GB的GDDR7显存。

根据NVIDIA公布的数据,Rubin CPX在NVFP4精度下峰值算力可达30 PFlops(每秒3亿亿次运算),能够支持百万级token的推理任务。

此外,在处理长上下文场景时,其注意力机制性能相较GB300 NVL72最多提升3倍。

需要指出的是,Rubin CPX目前仅为官方发布阶段,实际产品要到2026年底才会正式上市——没错,正是明年年底。

此前,NVIDIA已透露下一代Rubin GPU与Vera CPU已在台积电成功完成流片,进展符合预期。

NVIDIA官宣新GPU Rubin CPX!多达128GB显存、推理性能高达百万token

网友留言(0 条)

发表评论