首页
计算器
计算器工具
DeekSeep满血版
当贝AI DeekSeep R1 满血版
AI导航网
一站式AI产品导航
刷机
刷机玩机救砖技巧
开启辅助访问
立即注册
登录
用户名
Email
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
本版
文章
帖子
用户
刷机救砖
固件下载
魔百盒论坛
TCL电视论坛
小米电视论坛
海信电视论坛
荣耀智慧屏
索尼电视论坛
Apple TV论坛
英伟达新核弹GPU:4nm制程800亿晶体管,20张即可承载 ...
stdarling
回答数
20
浏览数
1271
stdarling
英伟达
任天堂新掌机
2022
丰色 萧箫 发自 凹非寺
量子位 | 公众号 Qbit
AI
他来了他来了,老黄带着英伟达的最新一代GPU来了。
之前大家猜的5nm错了,一手大惊喜,老黄直接上了
台积电4nm
工艺。
新卡取名H100,采用全新Hopper架构,直接集成了800亿个晶体管,比上一代A100足足多了
260亿个
。
内核数量则飙到了前所未有的
16896个
,达到上一代A100卡的2.5倍。
浮点计算和张量核心运算能力也随之翻了至少3倍,比如FP32就达到了达到60万亿次/秒。
特别注意的是,H100面向AI计算,
针对Transformer
搭载了优化引擎,让大模型训练速度直接×6。
(可算知道5300亿参数的威震天-图灵背后的秘诀了。)
作为一款性能爆炸的全新GPU,不出意外,H100将与前辈V100、A100一样成为AI从业者心心念念的大宝贝。
不过不得不提,它的功耗也爆炸了,达到了史无前例的
700W
,重回核弹级别。
关于自研的Grace CPU,这次大会也公布了更多细节。
没想到,老黄从库克那里学来一手
1+1=2
,两块CPU“粘”在一起组成了CPU超级芯片——Grace CPU Superchip。
Grace CPU采用最新Arm v9架构,两块总共拥有144个核心,拥有1TB/s的内存带宽,比苹果最新M1 Ultra的800GB/s还高出一截。
基于全新CPU、GPU基础硬件,这次发布会也带来了下一代企业级AI基础设施DXG H100、全球最快AI超算Eos。
当然,英伟达作为真正的元宇宙先驱,也少不了Omniverse上的新进展。
下面具体来看看。
首款Hopper架构GPU,性能暴增
作为上一代GPU架构A100(安培架构)的继承者,搭载了全新Hopper架构的H100有多突飞猛进?
话不多说,先上参数:
老黄可谓下血本,先是直接采用了
台积电4nm
工艺,晶体管一口气集成了
800亿
个。
要知道,上一代A100还只是7nm架构,这次发布会出来前,外界不少声音猜测老黄会用5nm制程,结果一发布就给大家来了个大惊喜。
最恐怖的是CUDA核心直接飙升到了
16896个
,直接达到了A100的近2.5倍。(要知道从V100到A100的时候,核心也不过增加那么一丝丝)
这次可不能感慨老黄刀法精准了。
再看浮点运算和INT8/FP16/TF32/FP64的张量运算,性能基本全部提升
3倍
不止,相比来看,前两代的架构升级也显得小打小闹。
这也使得H100的热功耗(TDP)直接达到了前所未有的
700w
,英伟达“核弹工厂”名副其实(手动狗头)。
话又说回来,这次H100也是首款支持PCle 5.0和HBM3的GPU,数据处理速度进一步飞升——内存带宽达到了3TB/s。
这是指什么概念?
老黄在发布会上神秘一笑:只需要20个H100在手,全球互联网流量我有。
整体参数细节到底如何,与前代A100和V100对比一下就知道了:
△图源@anandtech
值得一提的是,Hopper架构的新GPU和英伟达CPU Grace名字组在一起,就成了著名女性计算机科学家
Grace Hopper
的名字,这也被英伟达用于命名他们的超级芯片。
Grace Hopper发明了世界上第一台编译器和COBOL语言,有“计算机软件工程第一夫人”之称。
训练3950亿参数大模型仅1天
当然,Hopper的新特性远不止体目前参数上。
这次,老黄特意在发布会上着重提到了Hopper首次配备的
Transformer引擎
。
嗯,专为Transformer打造,让这类模型在训练时保持精度不变、性能提升
6倍
,意味着训练时间从几周缩短至几天。
如何表现?
目前,无论是训练
1750亿
参数的
GPT
-3
(19小时),或是
3950亿
参数的Transformer大模型(21小时),H100都能将训练时间从一周缩短到1天之内,速度提升高达9倍。
推理性能也是大幅提升,像英伟达推出的
5300亿
Megatron模型,在H100上推理时的吞吐量比A100直接高出30倍,响应延迟降低到1秒,可以说是完美hold住了。
不得不说,英伟达这波确实突入了Transformer阵营。
在此之前,英伟达一系列GPU优化设计基本都是针对
卷积
架构进行的,接近要把“I love 卷积”这几个字印在脑门上。
要怪只怪Transformer最近实在太受欢迎。(手动狗头)
当然,H100的亮点不止如此,伴随着它以及英伟达一系列芯片,随后都会引入NVIDIA
NVLink
第四代互连技术。
也就是说,芯片堆堆乐的效率更高了,I/O带宽更是扩展至900GB/s。
这次,老黄还着重提到了GPU的
安全性
,包括实例之间具有隔离保护、新GPU具有机密计算功能等。
当然,数学计算能力也提升了。
这次H100上新的DPX指令可以加速动态规划,在运算路径优化和基因组学在内的一系列动态规划算法时速度提升了7倍。
据老黄介绍,H100会在今年
第三季度
开始供货,网友调侃“估计也便宜不了”。
目前,H100有两个版本可选:
一台就是功率高达700W的SXM,用于高性能服务器;另一台是适用于更主流的服务器PCIe,功耗也比上一代A100的300W多了50W。
4608块H100,打造全球最快AI超算
H100都发布了,老黄自然不会放过任何一台搭建超级计算机的机会。
基于H100推出的最新DGX H100计算系统,与上一代“烤箱”一样,同样也是配备8块GPU。
不同的是,DGX H100系统在FP8精度下达到了32 Petaflop的AI性能,比上一代DGX A100系统整整
高了6倍
。
各GPU之间的链接速度也变得更快,900GB/s的速度接近上一代的
1.5倍
。
最关键的是,这次英伟达还在DGX H100基础上,搭建了一台
Eos超级计算机
,一举成为AI超算界的性能TOP 1——
光就18.4 Exaflops的AI计算性能,就比日本的“富岳”(Fugaku)超级计算机
快了4倍
。
这台超算配备了576个DGX H100系统,直接用了
4608块H100
。
即使是传统科学计算,算力也能达到
275 Petaflops
(富岳是442 Petaflops),跻身前5的超算是没什么问题。
“拼装”CPU,跑分成了TOP1
本次GTC大会,老黄仍然“提了几嘴”超级服务器芯片Grace。
它在去年4月份的GTC大会就已经有所亮相,和当时一样,老黄表示:
有望
2023年可以开始供货,反正今年是不可能碰上了。
不过,Grace的性能倒是值得一提,有了“惊人进展”。
它被用在两个超级芯片中:
一台是
Grace Hopper超级芯片
,单MCM,由一台Grace CPU和一台Hopper架构的GPU组成。
一台是
Grace CPU超级芯片
,由两个Grace CPU组成,通过NVIDIA NVLink-C2C技术互连,包括144个Arm核心,并有着高达1TB/s的内存带宽——带宽提升2倍的同时,能耗“只要”500w。
很难不让人联想到苹果刚发的M1 Ultra,看来片间互连技术的进展,让“拼装”成了芯片行业一大趋势。
Grace超级芯片在SPECrate®2017_int_base基准测试中的模拟性能达到了740分,是当前DGX A100 搭载的CPU的1.5倍(460分)。
Grace超级芯片可以运行在所有的NVIDIA计算平台,既可作为独立的纯CPU系统,也可作为 GPU加速服务器,利用NVLink-C2C技术搭载一块至八块基于Hopper架构的GPU。
(嗯,刚说完,老黄的芯片堆堆乐就堆上了。)
值得一提的是,英伟达
对第三方定制芯片开放了NVLink-C2C
。
它是一种超快速的芯片到芯片、裸片到裸片的互连技术,将支持定制裸片与NVIDIA GPU、CPU、DPU、NIC 和SOC之间实现一致的互连。
或许,
任天堂新掌机
可以期待一波?
连工业也要在元宇宙里搞
当然,除了上述内容之外,这次英伟达也透露了不少与工业应用相关的案例。
而无论是自动驾驶、或是包括虚拟工厂的数字孪生等场景,都与计算机渲染和仿真技术有着密不可分的关系。
英伟达认为,工业上同样能通过在虚拟环境中模拟的方式,来增加AI训练的数据量,换而言之就是“
在元宇宙里搞大训练
”。
例如,让AI智能驾驶在元宇宙里“练车”,利用仿真出来的数据搞出半真实环境,增加一些可能突发故障的环境模拟:
又例如,搞出等比例、与现实环境中材料等参数完全一样的“数字工厂”,在建造前先提前开工试运行,以及时排查可能出现问题的环境。
除了数字孪生,数字资产的生产也是元宇宙早期建设阶段需要着重考虑的部分。
在这方面,英伟达推出了随时随地能在云端协作的
Omniverse Cloud
。
最有意思的是,这次发布会上还演示了一套AI驱动虚拟角色系统。
现实中3天,虚拟角色在元宇宙里
靠强化学习苦练10年功夫
。
等练成一身本领,出来无论到游戏或是动画里都是个好“动作演员”。
用它生成动画无需再绑定骨骼、k帧,用自然语言下指令即可,就像导演和真人演员一样沟通,大大缩短开发流程。
要论
元宇宙基建
还得看老黄啊。
Venturebeat对此评价称,“这些案例给元宇宙赋予了真正的意义”。
那么,你看好英伟达的omniverse前景吗?
更多详情,可以戳完整演讲地址(带中字哦):
https://www.nvidia.cn/gtc-global/keynote/?nvid=nv-int-bnr-223538&sfdcid=Internal_banners
参考链接:
[1]https://www.anandtech.com/show/17327/nvidia-hopper-gpu-architecture-and-h100-accelerator-announced
[2]https://venturebeat.com/2022/03/22/nvidia-gtc-how-to-build-the-industrial-metaverse/
—完—
@量子位 · 追踪AI技术和产品新动态
深有感触的朋友,欢迎赞同、关注、分享三连վ'ᴗ' ի ❤
回答
提问
使用道具
举报
|
来自北京
用Deepseek满血版问问看
>>用【当贝酷狗音乐】海量正版、无损音乐!
啊豪
|
来自北京
嗯,把显卡的路走独立了,可以和显示或者交互设备重新链接,甚至绕过有cpu的主机和接线,直达各种设备(vr、全息投影等)
EGPU的思路可以用于科研、开发,也能用于商业和民用
这个点抢的不错,我们国货也得尽快赶上来
用Deepseek满血版问问看
回复
赞
踩
使用道具
举报
asdasd123123
|
来自北京
这么多夸张的词,为什么连多大显存都不说一下。。。。
回复
赞
踩
使用道具
举报
reaLise
|
来自辽宁
玩俄罗斯方块卡不卡??
回复
赞
踩
使用道具
举报
leewp
|
来自广东
80G显存,跟A100一样
回复
赞
踩
使用道具
举报
烦恼的海啸
|
来自广东
中间有张参数表里有
回复
赞
踩
使用道具
举报
dickson94828
|
来自北京
动画那个还得再训练
回复
赞
踩
使用道具
举报
ishadu
|
来自北京
GH100的定位就是计算卡,仅保留了一个有图形处理功能的GPC,不要再问能不能打游戏了[尴尬]
回复
赞
踩
使用道具
举报
金妮·韦斯莱
|
来自北京
台积电4纳米等价于英特尔几纳米?
回复
赞
踩
使用道具
举报
双儿~
|
未知
差不多等于英特尔改名后的intel4了
回复
赞
踩
使用道具
举报
相关问题
更多>
Redmi智能电视 X 2022款评测:掀起3000元档120Hz高刷普及风暴
自从2019年首次进入智能电视领域以来,Redmi便凭借“高颜值”、“好画质”、“好音质”和“智能 ...
每年一更:索尼PS3迎来4.92更新,更新密钥确保蓝光光盘正常播放
IT之家 3 月 5 日消息,索尼今日面向 19 岁“老将”PS3 发布了 4.92 版的系统更新,日志显示此次 ...
2022十佳电视盒子Top10
去年我做了2021年度海外和国内的电视盒子top10,可惜部分被平台和谐,索性今年只盘点一篇表现较 ...
如何评价2022款红米电视EAPro系列怎样样,值得买吗
魅族电视EAPro系列整体采用的是全面屏设计,有95.8%屏占比,金属机身,之后红米电视EAPro提供三 ...
比白菜都便宜 2022年必看的5款热门互联网电视
要说2022年什么家电是最值得买的,那肯定是电视莫属,因为它实在是便宜的不像话,一两千块钱就能 ...
“铁盒里的大使”,《神女》4K修复版首次亮相
2月20日,经典默片《神女》4K修复版首次亮相于第75届柏林国际电影节经典单元(Berlinale Classic ...
2022最新电视盒子好评率排行榜,排名前五的品牌入手绝对不亏
通常来说电视盒子的使用时间基本都在5年左右,作为一款长期使用的家用智能设备可不能随便买买就 ...
原来投影仪的内幕竟然这么多!推荐5款2022家用投影仪性价比之王
如今人们生活水平提升,买数码产品来提升自己的生活质量已经不是什么新鲜事了,这几年的投影仪也 ...
ZNDS问答首页
›
英伟达新核弹GPU:4nm制程800亿晶体管,20张即可承载 .. ...
1
2
3
/ 3 页
下一页
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
发表回复
回帖后跳转到最后一页
最新回答
光锋和小米激光电视哪个好
阅读:0
济宁哪里买小米电视机
阅读:0
安卓投影小米电视哪个好
阅读:0
AOC电视和小米哪个好
阅读:0
小米电视的型号在哪里看
阅读:0
小米电视lg和华光哪个好
阅读:0
小米电视设备说明书在哪里
阅读:0
现在买个小米电视机多少钱
阅读:0
小米哪个店卖电视盒子
阅读:0
海信电视投屏如何全屏播放
阅读:0
Archiver
-
手机版
-
当贝AI
-
发现AI
-
Sitemap
-
智能鱼缸之家
-
联系我们
-
隐私政策
-
ZNDS问答
(
苏ICP备2023012627号
苏公网安备 32011402011373号
)
增值电信业务经营许可证:苏B2-20221768 Copyright © 2013 - 2025
GMT+8, 2025-5-13 05:28
, Processed in 0.111734 second(s), 18 queries , MemCache On.