全球最小AI「桌面超算」发布,英伟达B端C端两手抓
每年在美国拉斯维加斯举办的国际消费电子展(CES)是科技圈最重要的盛会。今年,英伟达创始人兼首席执行官黄仁勋发表开幕主题演讲,推出了多款新品 —— GeForce RTX 50系列GPU、支持机器人开发的世界模型Cosmos,以及一台被他称作“世界上最小的个人超级计算机”Project Digits。
本文引用地址://www.cazqn.com/article/202501/466169.htm1993年,英伟达创立后经历了多个重要时间节点:1999年,发布世界首款GPU产品;2006年,推出GeForce 8800 Ultra显卡,并提出CUDA(统一计算架构)这一概念,引领了后续的GPU算力发展。在AI领域,英伟达在十多年前就已经洞察到AI的影响力,并一路伴随着AI行业的发展。
亮相即“王炸”
GeForce RTX 50系列GPU中最受瞩目的GeForce RTX 5090,是英伟达目前最强大的显卡,其速度是其前身RTX 4090的两倍。新一代基于Blackwell架构的RTX 5090晶体管数量从上一代的763亿(Ada Lovelace架构)提升至920亿,可提供3400 TOPS算力,具备4000 AI TOPS(每秒万亿次操作)的性能。
此次英伟达公布了RTX 5090、RTX 5080、RTX 5070 Ti、RTX 5070四款桌面平台GPU和对应的四款移动平台GPU。RTX 5070、RTX 5070 Ti、RTX 5080和RTX 5090的售价分别为:549美元、749美元、999美元和1999美元;而搭载RTX 5090、RTX 5080、5070 Ti和5070的笔记本售价分别为2899、2199、1599和1299美元,预计将于三月份上市。
黄仁勋特别提到,售价仅549美元的RTX 5070显卡的性能将足以媲美去年推出的RTX 4090 GPU,而后者的售价高达1600美元。黄仁勋直言:“没有人工智能,这是不可能实现的”。到了AI时代,传统基于CPU的说明式硬编码开发模式,也应该转型为基于GPU、机器学习与神经网络的AI模式。而强大的GPU,正是这一转变的起点。
值得注意的是,由于美国出口管制,英伟达无法在中国市场销售RTX 5090,取而代之是RTX 5090D,定价16499元。和RTX 5090相比,RTX 5090D拥有2375AI TOPS算力,是RTX 5090的70%,是RTX 4090D的200%。
在RTX 50系显卡上,英伟达同步推出了最新一代的DLSS 4。简单来说,DLSS 4改用了由英伟达超级计算机训练的全新Transformer AI模型,提升了DLSS 4的渲染精度和稳定性,从而为用户提供更好的画面和更高的分辨率。另外,基于第五代Tensor Core的能力,RTX 50系列的DLSS多帧生成技术取代了RTX 40系列的DLSS帧生成,可以为每一个实际渲染帧额外生成最多3帧画面,这对游戏平均帧率有相当显著的提升。
全新物理AI模型Cosmos
此外,英伟达还宣布推出Cosmos平台,集成了先进的生成式世界基础模型(WFM)、高级分词器、护栏系统和加速的视频处理管道,这个平台被称为加速「物理AI」发展的关键一步,将极大地推动自动驾驶和机器人等对物理场景要求较高的领域迈向更高水平。
物理AI(也称为生成式物理AI)是一种使自主机器能够在真实物理世界中感知、理解和执行复杂交互操作的技术。它扩展了传统的生成式AI,使其能够理解3D世界的空间关系和物理行为,通俗地理解就是人工智能反馈的内容要符合物理规律。例如,传统的机器人只能按照预设程序执行任务,而搭载物理AI的机器人则能够更好地识别物体、预测运动轨迹、并根据物理规律做出相应的反应。
“物理AI将彻底改变价值50万亿美元的制造业和物流业,”黄仁勋在本次CES国际消费电子展上表示,从汽车、卡车到工厂、仓库,所有移动的事物都将实现机器人化并由AI驱动,强调AI的新一波浪潮是物理AI。
物理AI的开发极为复杂,需要海量的真实世界数据和长时间的测试,开发成本高昂。而英伟达的Cosmos平台使用了NeMo Curator框架以及CUDA加速数据处理流水线,在14天内即可完成对2000万小时视频的处理工作,而这一任务在传统CPU环境下需要3.4年。
英伟达构建了一个完整的物理AI生态系统,包含以Omniverse、Cosmos、Isaac Sim等关键组成部分。开发者可以利用Omniverse创建虚拟的三维场景,再由Cosmo生成如同高度拟真的训练场景,其中Cosmos WFMs能够快速生成基于真实物理规律的高仿真数据,降低依赖昂贵现实数据的需求。这些模型通过将文本、图像、视频以及机器人传感器数据结合,生成多样化的物理环境场景,比如雪地驾驶、拥挤仓库等。
Cosmos模型将有三种尺寸:Nano、Super和Ultra。英伟达表示Cosmos模型会以开放模型许可的方式发布,开发者可以通过NVIDIA API目录预览首批模型,或从NVIDIA NG目录或Hugging Face下载完整的模型家族和微调框架。目前,多家领先的机器人和汽车公司,包括1X、Agile Robots、以及汽车共享巨头Uber,已成为首批采用Cosmos平台的企业,或许机器人也即将迎来“ChatGPT时刻”。
可以说Cosmos的发布,补全了英伟达物理AI体系中“理解世界”的重要一环。从此次发布的产品来看,英伟达在AI领域的进度已经甩掉同行一大截,而在CUDA、Tensor的“封锁下”,英伟达还将继续引领高算力AI平台,乃至整个AI行业的发展,成为AI产业名副其实的“柱石”。
全球最小的个人AI超算
2025年,AI已经成为了科技发展的主战场,昂贵、庞大的AI超算,从某种程度上其实也阻碍了AI的进步。对此,黄仁勋带来了英伟达的「One More Thing」 —— Project Digits桌面AI超级计算机。
核心方面,Project Digits搭载的GB10超级芯片由Blackwell CPU和Grace CPU组成,其中Grace CPU包含20个ARM核心。同时,Project Digits也配备了128GB LPDDR5X内存和4TB SSD。另外,Project Digits除了可以单独使用,还可以两个单元叠加使用,叠加状态下甚至可以运行超过4000亿参的模型。
其实,市场一直关注英伟达在PC领域的动作。早在2023年年底,路透社就曝光过英伟达正在秘密研发一款基于ARM架构的PC CPU,支持Windows操作系统,进军个人电脑领域与英特尔、AMD的“x86联盟”竞争;2024年10月,台湾经济时报又爆出来自中国台湾供应链方面的消息,表示英伟达将与联发科合作设计一款基于3nm的PC CPU,2025年进军PC CPU领域。
但是Project Digits与先前爆料的PC CPU并非同一款产品。无论是功能还是目标用户,Project Digits定位上更接近于苹果Mac和微软Surface旗下的工作站计算机,而非一般意义上的个人电脑。黄仁勋表示:“我们将AI超级计算机放在每个数据科学家、AI研究人员和学生的办公桌上,使他们能够参与和塑造AI时代。”
这个产品本身尺寸类似Mac Mini,可以放在桌子上并使用标准电源插座供电,既能够用作小型工作站,也可以与现有PC配合使用。根据英伟达介绍,Project Digits定价3000美元,最快5月上市。但值得关注的是,英伟达在官方声明中提到了与联发科的合作,称联发科参与了GB10的设计,“在能效、性能和互连上做出了贡献”。
期待更高的重磅产品“缺席”?
英伟达通常会在CES展会上发布重要的产品公告,许多投资者希望获得Blackwell更具体的进展信息,以及对下一代数据中心GPU架构Rubin的更多介绍。但CES是消费电子产品的主场,黄仁勋在演进中并未透露更多数据中心产品业务线的信息,只提到“Blackwell已全面投入生产”。
此前,英伟达在2024年11月的财报电话会议中确认,Blackwell芯片的生产已在本季度加速,预计将提前向客户发货。市场预期,这些芯片将推动英伟达产品需求进入一个新的增长周期。2024年8月,其首款产品B200 GPU被曝存在设计缺陷,遇到了散热、封装紧缺等一系列工程难题,市场当时紧张猜测英伟达是否会延迟交货。
虽然在这次CES上没有等到更多相关的爆料,但根据英伟达的规划,本月月底即将发布的第四财季财报与3月要举办的GTC大会,才是英伟达回到主场的重头戏。
近年来,摩尔定律的发展速度有所放缓。然而,黄仁勋声称,英伟达的AI芯片正以自身的加速节奏发展,“我们可以同时构建架构、芯片、系统、库和算法,如果这样做,我们就能比摩尔定律更快地发展,因为我们可以在整个技术栈中进行创新”,性能提升速度已远超数十年来推动计算机技术进步的摩尔定律设定的标准,AI世界正以「超摩尔定律」的速度发展。
黄仁勋还强调,随着计算能力的提升,AI推理成本将逐步降低,类似于摩尔定律推动计算成本下降的历史进程。英伟达最新的数据中心超级芯片GB200 NVL72,在运行AI推理工作负载方面的速度比H100快30-40倍,成本将随着时间的推移而降低,预计这种趋势将随着AI推理模型的发展而继续下去。
评论