基于如此强大的性能,NV推出了一系列的AI开发平台,其中我认为最重要的是OmniVerse Digital Twin,数字孪生技术。我相信NV也是这么认为的,毕竟GTC 2022一共101分钟的Keynote视频中,从50:59~1:31:20,共计40分钟都是在介绍OmniVerse Digital Twin的应用前景。
而且还要注意到Hopper的内存带宽实际只提升了 50%,实际应用中要跑出理论3X的性能可以说是难上加难。
总结一下,就是不要被Hopper的3倍数字给唬住,从Hopper的内存带宽、SMs数量来看,这代H100的理论值提升是要远大于实际提升的。可能有一些高度优化的程序是可以用到的,但是对于更为“日常”和“通用”的任务来看,3倍不可期待~。
次世代计算卡对比:Nvidia vs AMD vs Intel
H100在深度学习性能上,可以说是暴打AMD了,AMD这边FP32 Matrix也才90.5T,Nvidia略微降低一点精度就500T了,整整差了5倍,FP16 和TF16 也是1000-2000T vs 400T不到的水平,再加上生态优势,差距还是不小。