阶段二:硬件卸载,协助 CPU 进行网络负载。随着云计算不断发展,普通网卡已经不能满足数据中心对虚拟化的要求,因此,第一代具备硬件加速能力的智能网卡 SmartNIC 演进而来。SmartNIC 核心是通过FPGA(现场可编程门阵列)协助 CPU 处理网络负载,并编程网络接口功能。此阶段的智能网卡延续了 TOE 卸载 CPU 负载逻辑,使用“网卡+FPGA”方法扩展网卡算力,实现用户自定义计算,以及硬件卸载能力。
“3U”一体(即 CPU、GPU、DPU)重塑数据中心算力架构。数据中心作为 IT 基础设施的重要组成部分,正快速发展,面向云计算商业化应用,对接入带宽、可靠性、灾备、弹性扩展等要求较高。
从未来算力需求来看,异构计算已成为重要发展趋势,高度集成化的片上数据中心的模式(Data Center InfrastructureOn a Chip)有望成为未来数据中心主流,即 CPU、GPU、DPU 共存形式。以NVIDIA 为例,其布局数据中心从核心到边缘(Edge)采用了“3U”一体的统一计算架构。通过 CPU、GPU、DPU 协同互补,可以在数据中心和边缘端达到高性能与高安全性。
Grace Hopper ARM系统准备好了吗?
英伟达还宣布 Grace CPU Superchip 将遵守获得 System Ready 认证的必要要求。以获得系统就绪认证。该认证意味着Arm芯片将与操作系统和软件一起“正常工作”,从而简化部署。Grace 还将支持虚拟化扩展,包括嵌套虚拟化和 S-EL2 支持。英伟达还列出了对以下内容的支持:
nRAS v1.1 通用中断控制器 (GIC) v4.1
n内存分区和监控 (MPAM)
n系统内存管理单元 (SMMU) v3.1
nArm 服务器基础系统架构 (SBSA) 可实现符合标准的硬件和软件接口
此外,为了在基于 Grace CPU 的系统上启用标准引导流程,Grace CPU被设计为支持Arm服务器基本引导要求(SBBR)。
对于缓存和带宽分区以及带宽监控,Grace CPU还支持Arm内存分区和监控(MPAM)。Grace CPU 还包括 Arm 性能监控单元,允许对 CPU 内核以及片上系统 (SoC) 架构中的其他子系统进行性能监控。这使得标准工具(例如 Linux perf)能够用于性能调查。英伟达的 Grace CPU 和 Grace Hopper Superchip 有望在 2023 年初发布,其中 Hopper 变体适用于 AI 训练、推理和 HPC,而双 CPU Grace 系统则专为 HPC 和云计算工作负载而设计。
想了解更多半导体产业前沿洞见、技术速递、趋势解析,欢迎关注微信公众号:半导体产业纵横(ID:ICViews)。