小讯AIGC

AIGC热门工具
AIGC写作平台
- AI写作工具
- AI论文写作
- AI论文查重
- AI聊天
- AI提示词
- AI内容检测
- AI公文
- AI问答
- AI阅读
- AI搜索
- AI小说
AIGC绘画平台
- AI绘画工具
- AI绘画提示
- AI绘画社区
- AI绘画模型
- AI-3D生成
- AI图形工作站
- AI图片审核
- AI搜索图片
- AI素材
- AI绘本
- PS·AI插件
AI 智能体平台
- 中文版GPTS
- ChatGLMS
- AI提示语
AIGC设计平台
- AI设计工具
- AI图像处理
- AI图像扩展
- AI商品图
- AI一键抠图
- AI标志设计
- AI空间设计
- AI服装设计
- AI字体设计
- AI头像/艺术照
- AI艺术二维码
AIGC视频平台
- AI视频生成
- AI数字人
- AI视频后期
- AI口播视频
- AI动作捕捉
- AI换脸
- AI博主
- AI视频模型
- AI字幕翻译
- 图片转视频
AIGC音频平台
- AI语音生成-文转音
- AI语音识别-音转文
- AI语音合成
- AI语音降噪
- AI音乐创作
- AI音乐鉴赏
AIGC办公平台
- AI办公工具
- AI制作PPT
- AI翻译
- AI思维导图
- AI会议助理
- AI文档处理
- AI总结摘要
- AI简历制作
- AI公益应用
AIGC学习平台
- AIGC免费课程
- AIGC专题课程
- AIGC精选专栏
- AI运营启发
- 京东AI好书推荐
- prompt学习
AIGC企业平台
- AI企业服务
- AI数字员工
- AI人力资源
- AI电子合同
- AI法律服务
- AI金融事务
- AI算力平台
- AI行业协会
- AI官方活动
AIGC运营平台
- AI营销工具
- AI电商增长
- AI行业门户
- AI流量优化
- AI舆情分析
- AI数据分析
- AI国际导航
- 全球大学AI
- 大陆大学AI
AIGC开发平台
- AI编程工具
- AI开发课堂
- AI开发框架
- AI开放平台
- AI开发者社区
- AI低(无)代码编程
- AI-SQL数据库
- AI训练模型
AI 大模型平台
- AI大语言模型
- AI视觉大模型
- AI视频大模型
- AI语音大模型
- AI多模态大模型
- AI教育大模型
- AI医学大模型
- AI法律大模型
- AI行业大模型
- AI海外大模型
AIGC服务平台
- AI基础设施
- AI应用接口API
- AI中文研究机构
- AI海外研究机构
- AI生命科学
- AI游戏应用
- AI安全技术
- AIGC元宇宙
AI图像工具
- AI常用图像工具
- AI图片插画生成
- AI图片背景移除
- AI图片无损调整
- AI图片优化修复
- AI图片物体抹除
AI写作工具
AI音频工具
AI视频工具
AI设计工具
AI编程工具
AI对话聊天
AI办公工具
- AI幻灯片和演示
- AI表格数据处理
- AI文档工具
- AI思维导图
- AI会议工具
- AI效率提升
AI语言翻译
AI内容检测
AI提示指令
AI训练模型
AI学习网站
AI开发框架
AIGC热门推荐
AIGC绘画工具
- AI绘画工具
- AI绘画提示
- AI绘画社区
- AI绘画模型
- AI-3D生成
- AI图形工作站
- AI图片审核
- AI搜索图片
- AI素材
- AI绘本
- PS·AI插件
- AI漫画翻译
AIGC智能对话
- AI智能助手
- AI聊天对话
- AI知识问答
- AI角色扮演
AIGC搜索引擎
AIGC设计工具
- AI设计工具
- AI图像处理
- AI图像扩展
- AI商品图
- AI一键抠图
- AI标志设计
- AI空间设计
- AI服装设计
- AI字体设计
- AI头像/艺术照
- AI艺术二维码
AIGC音频工具
- AI语音生成-文转音
- AI语音识别-音转文
- AI语音合成
- AI语音降噪
- AI音乐创作
- AI音乐鉴赏
AIGC办公效率
- AI制作PPT
- AI文档处理
- AI电子表格
- AI思维导图
- AI总结摘要
- AI翻译
- AI会议助理
- AI简历制作
- AI协作办公
- AI浏览器插件
AIGC学习资源
- AIGC免费课程
- AIGC专题课程
- AIGC精选专栏
- AI运营启发
- 京东AI好书推荐
- prompt学习
- 全球大学AI
- 大陆大学AI
- AI行业协会
- AI行业门户
- AI官方活动
- AI中文研究机构
- AI海外研究机构
- AI大赛
AIGC基础设施
- AI应用接口API
- AI基础设施
- AI算力平台
- AI云服务
AIGC应用场景
- AI营销工具
- AI数字员工
- AI法律服务
- AI电子合同
- AI人力资源
- AI数据分析
- AI企业服务
- AI流量优化
- AI舆情分析
- AI安全技术
AIGC行业应用
- AI金融事务
- AI跨境电商
- AI生命科学
- AI教育助理
- AI公益应用
- AI游戏应用
- AIGC元宇宙
AIGC导航推荐
AIGC行业证书
AIGC副业项目
AIGC绘画生成
- AI绘画工具
- AI绘本
- AI素材
- PS·AI插件
- AI-3D生成
- AI绘画提示
- AI绘画社区
- AI绘画模型
- AI图形工作站
- AI图片审核
- AI搜索图片
- AI漫画翻译
- AI博主
AIGC视频创作
- AI视频生成
- AI数字人
- AI换脸
- AI短剧
- AI视频后期
- AI动作捕捉
- AI视频模型
- AI字幕翻译
- 图片转视频
- AI动漫视频
- AI数字生命
AIGC创意设计
- AI设计工具
- AI商品图
- AI一键抠图
- AI写真
- AI图像扩展
- AI图像处理
- AI标志设计
- AI空间设计
- AI服装设计
- AI字体设计
- AI珠宝设计
- AI海报设计
- AI艺术二维码
- AI头像
- AI智能标注
AIGC音频处理
- AI语音生成（配音）
- AI语音识别
- AI语音合成
- AI语音降噪
- AI音乐创作
- AI同声传译
AIGC生命科学
- AI生物医学
- AI心理咨询
AIGC企业场景
- AI营销工具
- AI流量优化
- AI数字员工
- AI法律服务
- AI电子合同
- AI人力资源
- AI数据分析
- AI企业服务
- AI舆情分析
- AI安全技术
关于本站 ♥︎

英伟达新GPU，超长上下文/视频生成专用

量子位，2025-09-10 17:29:32

henry 发自凹非寺
量子位 | 公众号 QbitAI

老黄对token密集型任务下手了。

刚刚，在AI Infra Summit上，英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——

NVIDIA Rubin CPX GPU

老黄表示：Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU，可以让模型“一口气”推理数百万token。

而且，RubinCPX还能让你越用越省钱：每投资1亿美元，就能获得50亿美元的token收益。（50倍，你就赚吧，老黄说的）

对于“老黄画的饼”，CursorRunwayMagic等行业大佬也表示RubinCPX将分别在代码生产力生成式影像创作、以及大模型自主代理上带来突破。

那么好了好了，这GPU到底什么来头？

首款专为超大上下文AI打造的CUDA GPU

Rubin CPX基于NVIDIA Rubin架构，采用单片设计，内置NVFP4计算资源，主打AI推理的高性能和高能效。

它的性能提升，主要体现在以下几个方面：

在NVFP4精度下可提供高达30PFLOPS算力，做到性能与精度兼顾。
配备128GB高性价比GDDR7内存，应对最苛刻的上下文工作负载。
– 与NVIDIA GB300 NVL72系统相比，注意力机制处理速度提升3倍，让模型在处理更长上下文序列时也不掉速。

在这里，我们可以简单地拿A100来对比一下。

在算力方面，相较于A100的FP16精度，Rubin CPX专门优化过的NVFP4可以实现几个量级的性能提升。

而在内存方面，NVIDIA A100是40GB80GB，Rubin CPX则直接干到了128GB，让超大上下文处理毫无压力。

（注：在处理超大上下文任务时，GPU内存容量至关重要：模型需要一次性加载数百万token的权重、激活值和中间计算结果，如果内存不够，就只能分批处理，既影响速度，也限制模型规模）

单片就已经这么强，组合还可以让它更厉害！

英伟达表示，Rubin CPX还可以与NVIDIA Vera CPU和Rubin GPU协同工作，构成全新的NVIDIA Vera Rubin NVL144 CPX平台。

该平台在单机架内提供8EFLOPS的AI算力+100TB高速内存+每秒1.7PB的内存带宽，较NVIDIA GB300 NVL72系统的AI性能提升了7.5倍。

*（注：1EFLOPS = 1000PFLOPS ）

还没完，在此基础上，NVIDIA Vera Rubin NVL144 CPX还可以接入Quantum‑X800 InfiniBand 或Spectrum‑X以太网平台，实现大规模多机互联计算，让性能再上一个台阶。

预计明年正式推出

就像前面提到的，NVIDIA Rubin CPX 在长上下文处理上实现了最高性能和最高token收益——远超现有系统的设计极限。

老黄表示，这将像RTX 革新了图形和物理AI一样，改变AI时代的上下文推理能力。

在实际应用中，它能把AI编程助手从简单的代码生成工具，升级为能够理解并优化大规模软件项目的复杂系统。

在视频处理方面，由于AI模型分析一小时内容就可能涉及上百万token，突破了传统GPU的算力极限。

为此，Rubin CPX将视频解码、编码和长上下文推理处理集成在单芯片中，为视频搜索和高质量生成式视频等长时格式应用提供前所未有的能力。

此外，Rubin CPX将得到NVIDIA完整AI软件栈支持，从加速基础设施到企业级软件一应俱全。

最后，NVIDIA Rubin CPX预计将于2026年底正式推出。

Token密集型任务就要不密集了（一年后版）

[1]https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference
[2]https://www.runpod.io/articles/guides/nvidia-a100-gpu?utm_source=chatgpt.com