AI超算走进大众市场,端云软硬生态从此统一!
1月6日,在国际消费电子展(CES 2025)上,Nvidia英伟达发布了全新的RTX 50系列显卡和GenAI大模型软硬件产品和服务。此次最大的变化是,Nvidia英伟达面向个人和中小企业推出了完善的GenAI开发软硬件产品服务。
产品具体细节参数不再详细复述,AI顿悟涌现时给大家总结几个值得关注的亮点。
RTX 50系列显卡换上了最新的Blackwell架构,最RTX 5090配备最高的32GB显存,再配合全新的DLSS 4技术,性能同比上一代旗舰直接拉升2倍!就连售价549美元的RTX 5070显存也达到了12GB,性能直接赶上RTX 4090。RTX 5070笔记本电脑的显存也有8GB。
RTX 50系列统一采用最新的GDDR 7显存,不过后续数据显示,这一规格于LPDDR 5X内存相当,比不上最新的LPDDR 5T。
具体价格上,配备32GB显存的RTX 5090售价1999美元,16GB显存的RTX 5080售价999美元,16GB显存的RTX 5070Ti售价749美元,12GB显存的RTX 5070只卖549美元。
具体AI性能数值上,入门级的RTX 5070都达到了988TOPS,而微软对端侧AI性能的要求是40TOPS,这种疯狂的性能提升,未来带来的是端侧本地AI的普及。
而且新产品全部普及了FP4精度,这一技术可以直接通过给大模型计算过程进行“四舍五入”,从而大幅舍弃大量低概率答案、提高大模型效率,非常重要。具体技术原理大家可以点击《怎样提高AI大模型效率?》进行了解。同时,软件驱动引擎上也全面引入Transformer大模型技术来提升性能,可以说是软硬件全面进行AI优化的一代产品。
爽吗?
当然也有明显的缺憾,对于GenAI大模型来说,显存大小在很多情况下比绝对性能重要。像苹果Mac M系列芯片搭载的统一内存技术,现在入门也达到了16GB。如果老黄黄仁勋也能把统一内存技术学过来,该多好!
你还别说!这次Nvidia英伟达真的有!
在最后的One More Thing环节,黄仁勋发布了全球最小AI超级计算机Project DIGITS。
这款产品与Mac Mini大小相似,搭载全新GB10芯片。GB10的GPU采用Blackwell内核,CPU用的是联发科协助设计的ARM内核Grace,采用20个Arm能效核设计。CPU、GPU并不是集成在同一芯片内,而是通过NVLink-C2C互连技术进行连接,配备128GB统一内存和4TB NVMe接口固态存储,起售价3000美元。
这配置比苹果M4 Mac Mini顶配高出一个级别,价格又低出两档。黄仁勋这完全是在硬刚。
当然苹果macOS的软硬件生态更宽广,并不能直接对比。
从另一个角度来看,Project DIGITS可以直接提供了苹果生态之外,最优的消费级ARM架构计算机选择。在AI开发生态的基础上,其他软件服务生态有望快速成长起来,成长为通用的计算机平台。
官方数据显示,单台Project DIGITS在FP4精度下AI性能达到1PFLOPS,能运行2000亿参数大模型。
而通过NVIDIA ConnectX网络连接技术,将两台相连后,能直接跑4050亿个参数的AI模型。在当下市场对GenAI大模型开发的迫切需求下, Project DIGITS的市场想象力巨大。
这也是Nvidia英伟达首次直接进入消费电子市场,对整个行业来说意义重大。这直接现在正在主打GenAI大模型开发的苹果Mac系列AI PC,失色不少。毕竟两者在GenAI大模型领域的软硬件服务体验不可同日而语,Nvidia英伟达在游戏和图形开发生态上也足够强势,有望彻底改写市场格局。对比之下,苹果MLX开发框架堪堪可用,希望在此压力下,苹果Mac能够多多降价,真正造福用户。
库克刚刚在AI PC上开了个好头,就被黄仁勋的阵仗给镇住了。真是哭了!
Nvidia英伟达也是真的努力!
基于此,Nvidia英伟达也推出了完善的AI大模型开发者软件服务。。
除了CUDA开发框架这个传统强项之外,NVIDIA NIM云原生微服务、Nemotron基础模型定制、Omniverse数字孪生内容引擎等全系AI服务生态都进行了扩充和升级。方便开发者快速定制自己的大模型,制作自己的AI Agent智能体,训练物理AI。特别是基于物理AI开发机器人、自动驾驶以及其他工业级数字孪生服务,被黄仁勋视为未来计算机的核心生态。
为了提供更好的AI Agent智能体开发服务,Nvidia英伟达直接引入了CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases五家AI Agent编排和管理工具供应商合作,打造了AI Blueprint。
像这次新推出的Llama Nemotron系列基础模型,开发者可以直接上手制作自己的AI Agent智能体。还有视觉、图像生成、语音、RAG等多模态模型服务,除了视频生成模型之外,多模态大模型服务样样齐全,而且这次在Project DIGITS个人超算的强悍性能下,全都可以实现私有服务部署。
甚至这些服务也可以直接部署在RTX 50系列的AI PC上。
Nvidia英伟达还为游戏和直播用户提供了NVIDIA Broadcast、Streamlabs两项专业的音质画质优化和播控系统。还有便于日常各类型文件图片办公处理的语音视觉语言多模态服务,Project R2X。
这不仅仅是从企业级AI开发市场进入到小团体和个人AI开发市场,还一步踏进消费者AI服务生态里。未来,Nvidia像苹果一样全面进入大众消费市场,也不会让人惊讶。
实际上,黄仁勋对未来消费级和企业级的AI超级计算机的预期已经非常明确。
正像千禧年计算机性能和形态快速升级一样,当下的AI超级计算机也走在同样的路上。内存技术和算力都在以超越摩尔定律的速度快速增长,电源技术也已经获得重大突破,HPC超级计算机两三年内走入大众消费市场并不是梦想。
不过目前看起来较大的阻碍是,Nvidia英伟达HPC即AI超算产品搭载的是Linux操作系统,在系统生态上属于云端服务器。
于是,这次新产品发布演讲,黄仁勋罕见的喊话微软,大赞微软推出的WSL 2,在Windows系统里嵌入完整Linux操作系统服务的子系统模型。这一技术架构直接统一了端云开发体验,即提供了PC端软硬件服务生态,还给出了优秀的云端开发部署体验。
这种端云融合的软硬件生态体验,有望成为消费级计算机下一步发展的方向。即:你买的AI PC既是个人娱乐电脑,也是云服务器。毕竟你的电脑都已经是硅基生命了,那就不可能以云端超算的附属品的地位出现。
黄仁勋这话听起来好像是在喊话微软,让对方主动操作系统主动适配自家Project DIGITS个人超算。毕竟现在Windows操作系统ARM架构电脑生态还遥遥无期,能搭上Nvidia英伟达的快车,说不定一次就成了!而采用Nvidia英伟达GPU的AI PC搭载的是Windows操作系统。
此次,黄仁勋也展示了由72个Blackwell GPU芯片组件的的NVLink72超算,规模巨大,活像一个“盾牌”。这看起来更像HPC超级计算机版本的工作站,更让人相信端云软硬件生态融合将会快速到来。
黄仁勋可以说做到了张口吃遍天,一边Nvidia英伟达的Omniverse数字孪生服务进入苹果生态,成为基础服务,另一边还能推出Project DIGITS直接硬刚Mac Mini;一方面自己的HPC和AI开发者生态一骑绝尘,另一方面还要借势微软的WSL 2端云开发服务,为自己所用。
库克和纳德拉也只有恭恭敬敬的份。 |