车载计算平台由硬件平台+系统软件+功能软件构成 智能驾驶产业主要可以分为感知层、决策层与执行层。
报告针对车载计算平台全产业链的每个细分环节,从其概念、技术路径、发展趋势、竞争格局等 内容展开。车载计算平台是智能网联汽车的“大脑”,从硬件到软件主要包括:
异构硬件平台:CPU 计算单元、AI 单元(GPU、ASIC、FPGA)、MCU 控制单元、存储、ISP 等其他硬件组成的自动驾驶域控制器;
系统软件:硬件抽象层(Hypervisor、BSP)、操作系统内核(QNX/Linux/ Andriod/Vxworks)、中间件组件等;
功能软件:自动驾驶通用框架(感知、决策、执行)、功能软件通用框架 (数据抽象/数据流框架/基础服务);
其他:工具链(开发、仿真、调试、测试等)、以及安全体系(功能安全、 信息安全等)。
EEA 架构逐渐走向域集中,DCU 应运而生
单车 ECU 数量激增,无法满足汽车智能化的需求。1980 年代开始,以机械为 主宰的汽车行业内掀起一场电子电气化革命。
电子控制单元(Electronic Control Unit,ECU)占领了整个汽车,此时的汽车电子电气架构都是分布式的,各个 ECU 都通过 CAN(Controller Area Network,控制器域网络)。
或 LIN(LocalInterconnect Network,局部互联网络)总线链接在一起,通过工程师预设好的 通信协议交换信息。在传统的 EEA 架构下,ECU 是系统的核心,智能功能的 升级依赖于 ECU 数量的累加。
原有智能化升级方式面临研发和生产成本剧增、安全性降低、算力不足等问题, 传统分布式架构亟需升级,传统 EEA 架构主要面临以下问题:
控制器数 量过多:各级别汽车 ECU 数量都在逐年递增,每台汽车搭载的 ECU 平均 25 个,一些高端车型通常会超过 100 个;
线束布置过于复杂:ECU 数量越 多,总线数量必将更长,2000 年奔驰 S 级轿车的电子系统已经拥有 80 个 ECU, 1,900 条总长达 4km 的通信总线。
2007 年奥迪 Q7 和保时捷卡宴的总线长度突 破 6km,重量超过 70kg,基本成为位列发动机之后的全车第二重部件;
“跨域”信号传输需求增加:智能驾驶需要大量的“跨域”信号传输,环境传 感器(雷达,视频和激光雷达)产生了大量数据传输的需求,这也对传统分散 式 ECU 基础架构提出了挑战。
为适应智能化需求,催生出以 DCU 为主的域集中架构。为了控制总线长度、 降低 ECU 数量,从而降低电子部件重量、降低整车制造成本。
将分散的控制器 按照功能域划分、集成为运算能力更强的域控制器(Domain Control Unit,DCU) 的想法应运而生。
博世用三类 EEA 架构共六个阶段来展示架构演进方向:分布 式(模块化、集成化)、域集中式(集中化、域融合)、集中式(车载电脑、 车-云计算)。
功能域与空间域是当前域控制器发展的两条路径。域控制器根据划分方式,主 要可以分为以五大功能域划分和以车辆特定物理区域划分两种。
相较于纯粹以功能为导向的域控制器,空间域划分的集中化程度更高,对 OEM 厂商自身开 发能力要求也会更高:基于功能划分的域控制器:典型代表博世、大陆等传统 Tier 1
博世、大陆等传统 Tier 1 将汽车 EEA 架构按功能划分为动力域(安全)、底盘 域(车辆运动)、信息娱乐域(座舱域)、自动驾驶域(辅助驾驶)和车身域 (车身电子)五大区域。
每个区域对应推出相应的域控制器,最后再通过 CAN/LIN 等通讯方式链接至主干线甚至托管至云端,从而实现整车信息数据的 交互。
基于空间划分的域控制器:典型代表特斯拉
基于空间划分的域控制器是以车辆特定物理区域为边界来进行功能划分,相较 于纯粹以功能为导向的域控制器,其集中化程度更高。
特斯拉则是其中的典型 代表,2012 年 Model S 或是以典型的功能域划分为主,2017 年推出 Model 3 则直接进入准中央架构阶段,特斯拉的 EE 架构只有三大部分。
包括 CCM(中 央计算模块)、BCM LH(左车身控制模块)、BCM RH(右车身控制模块)。 中央计算模块直接整合了驾驶辅助系统(ADAS)和信息娱乐系统(IVI)两大 域,以及外部链接和车内通信系统域功能;
左车身控制模块和右车身控制模块 分别负责剩下的车身与便利系统、底盘与安全系统和部分动力系统的功能。
特 斯拉的准中央 E/E 架构已带来了线束革命,Model S/Model X 整车线束的长度 是 3 公里,Model 3 整车线束的长度缩短到了 1.5 公里,Model Y 进一步缩短到 1 公里左右,特斯拉最终的计划是将线束长度缩短至 100 米。
以功能域划分的域集中式会是大部分主机厂当下的主要选择。采用功能域或是 空间域,核心或是取决于 OEM 自身的实力和与供应商体系的博弈。
OEM 未来 会加大垂直整合程度,将核心软硬件尽可能掌握在自个手中,形成技术壁垒。 但是目前来看,以大部分主机厂和 Tier 1 自身的战略布局。
预计大部分主机厂 仍会使用混合域的 EEA 架构,即部分功能域集中化,形成“分布式 ECU+域控 制器”的过渡方案。
最后形成“Super controller(中央超级计算机)+ Zonal control unit(区控制器)”的架构,这一演进过程可能长达 5-10 年。
单车智能化逐步提升,对计算平台的需求持续增加
当前自动驾驶正处在 L2 向 L3 级别跨越发展的关键阶段。其中,L2 级的 ADAS 是实现高等级自动驾驶的基础,从全球各车企自动驾驶量产时间表来看,L3 级 别自动驾驶即将迎来大规模地商业化落地。
随着自动驾驶级别的提升,单车传感器的数量呈倍级增加。预计自动驾驶 Level 1-2 级需要 10-20 个传感器,Level 3 级需要 20-30 个传感器,Level 4-5 级需要 40-50 个传感器。
Level 1-2 级别:通常具有 1 个前置远程雷达和 1 个摄像头,用于自适应巡航 控制,紧急制动辅助和车道偏离警告/辅助。
2 个向后的中程雷达可实现盲点 检测,外加 4 个摄像头和 12 个超声波雷达则可实现 360 度视角的泊车辅助功 能。预计 Level 1-2 的总传感器数量约为 10-20 个左右。
Level 3 级别:在 Level 1-2 配置的基础上,外加 1 个远程激光雷达,由于主 动距离测量,激光雷达还具有高分辨率,广角和高精度的特点这对于检测 和分类对象或跟踪地标以进行定位将是必需的。
对于高速公路领航系统 (Highway pilot)应用,通常会额外增加 1 颗后向的远程激光雷达。
预计会 使用 6-8 个摄像头,8-12 个超声波雷达和 4-8 个毫米波雷达,以及 1 个激光 雷达,因此,预计 Level 3 的传感器总数量会在 20-30 个左右。
Level 4-5 级别:通常需要多种传感器进行 360°视角的交叉验证,以消除每 种传感器的弱点。预计会使用 8-15 个摄像头,8-12 个超声波雷达和 6-12 个 毫米波雷达,以及 1-3 个激光雷达,因此,预计用于 Level 4 至 5 的传感器总 数量会在 30-40 个左右。
随着自动驾驶等级的提高,所需的算力高速提升。汽车自动驾驶的智能化水平取决于算法是否强大,从 L1 到 L5,自动驾驶每提升一台等级,算力要求也同 样提升一台等级:
L3 之前,自动驾驶所需算力较低;L3 需要的 AI 算力达到 20TOPS;L3 之后,算力要求数十倍增长,L4 接近 400TOPS,L5 算力要求更 为严苛,达到 4000+TOPS。
每增加一级自动驾驶等级,算力需求则相应增长 一台数量级。根据英特尔推算,在全自动驾驶时代,每辆汽车每天产生的数据 量将高达 4000GB。
硬件平台之一:芯片,计算芯片是算力时代下智能网联汽车的核心
计算芯片可分为 MCU 芯片与 SoC 芯片。随着汽车 EE 架构的不断革新,汽车 半导体高速发展,按功能不同,汽车半导体可分为汽车芯片和功率半导体。
在汽车芯片中,最重要的是计算芯片,按集成规模不同,可分为 MCU 芯片与 SoC 芯片
MCU(Micro Control Unit)微控制器,是将计算机的 CPU、RAM、ROM、定 时计数器和多种 I/O 接口集成在一片芯片上,形成芯片级的芯片;
而 SoC (System on Chip)指的是片上系统,与 MCU 不同的是,SoC 是系统级的芯 片,它既像 MCU 那样有内置 RAM、ROM,同时又可以运行操作系统。
智能化趋势驱动汽车芯片从 MCU 向 SoC 过渡。自动驾驶对汽车底层硬件提出 了更高的要求,实现单一功能的单一芯片只能提供简单的逻辑计算。
无法提供 强大的算力支持,新的 EE 架构推动汽车芯片从单一芯片级芯片 MCU 向系统级 芯片 SoC 过渡。
SoC 市场高速发展,预计 2026 年市场规模达到 120 亿美元。汽车智能化落地 加速了车规级 SoC 的需求,也带动了其发展,相较于车载 MCU 的平稳增长, SoC 市场呈现高速增长的趋势。
根据 Global Market Insights 的数据,预计全球 车规级 SoC 市场将从 2019 年的 10 亿美元达到 2026 年的 160 亿美元,CAGR 达到 35%,远超同期汽车半导体整体增速。
传统 MCU:MCU 需求稳步增长,海外寡头长期垄断
MCU 是 ECU 的运算大脑。ECU(Electronic Control Unit,电子控制单元)是 汽车 EE架构的基本单位,每个 ECU 负责不同的功能。MCU 芯片嵌入在 ECU 中 作为运算大脑。
当传感器输入信号,输入处理器对信号进行模数转换、放大等 处理后,传递给 MCU 进行运算处理,然后输出处理器对信号进行功率放大、 数模转换等,使其驱动如电池阀、电动机、开关等被控元件工作。
MCU 根据不同场景需求,有 8 位、16 位和 32 位。8 位 MCU 主要应用于车体 各子系统中较低端的控制功能,包括车窗、座椅、空调、风扇、雨刷和车门控 制等。
16 位 MCU 主要应用为动力传动系统,如引擎控制、齿轮与离合器控制 和电子式涡轮系统等,也适合用于底盘机构上,如悬吊系统、电子动力方向盘、 电子刹车等。
32 位 MCU 主要应用包括仪表板控制、车身控制以及部分新兴的 智能性和实时性的安全功能。在目前市场的主流 MCU 当中,8 位和 32 位是最 大的两个阵营。
汽车智能化不断渗透,单车 MCU 需求增加。随着汽车 EE 架构的演变,单车 MCU 需求量不断增加。自动驾驶浪潮带动 MCU 需求。
根据 IHS 统计,与传统 燃油车单车相比,智能驾驶汽车所需 MCU 数量是其 4 倍以上,且高位数 MCU 由于其高算力将扮演重要角色。
MCU 市场稳步发展,预计 2026 年全球规模达 88 亿美元。在市场规模上,全 球 MCU 市场呈现稳步发展的趋势,根据 IC Insights 估计。
预计全球 MCU 市 场规模从 2020 年的 65 亿美元达到 2026 年的 88 亿美元,CAGR 达到 5.17%, 略低于同期汽车半导体增速。
同时我国 MCU 发展与世界齐头并进,预计 2026 年市场规模达到 56 亿元,CAGR 达到 5.33%,与世界同期基本持平。
瑞萨、恩智浦、英飞凌等海外厂商占据主要市场份额,国产厂商渗透率较低。 目前全球 MCU 市场呈现寡头竞争局面,市占率靠前的瑞萨、恩智浦、英飞凌 等厂商均是国际厂商。
CR7 占比达到 98%,由于车规级 MCU 研发周期较长, 认证要求较高,目前国内厂商渗透率较低,仅有几家企业能够实现中低端产品 的量产。
智能座舱 SoC:高通在中高端数字座舱呈现垄断局面
一芯多屏不断普及,高通在中高端数字座舱呈现垄断地位。伴随着数字座舱渗 透率不断提升,车内数量不断增加,屏幕尺寸不断增大,智能座舱快速普及, 一芯多屏逐渐成为主流,也带动智能座舱 SoC 芯片的快速放量。
SoC 应用在智 能汽车上主要有智能座舱以及自动驾驶两方面,相比于自动驾驶 SoC,座舱域 SoC 由于要求相对较低,成为 SoC 落地智能汽车的先行者。
高通、恩智浦、德 州仪器、英特尔、联发科等各家不断更新其座舱 SoC 产品,在中高端数字座舱 域,目前高通呈现垄断地位。
目前,高通已经赢得全球领先的 20+家汽车制造商的信息影音和数字座舱项目,高通骁龙 820A 和 8155 两代平台成为众多车型 数字座舱平台的主流选择。
高通也将推出的第四代座舱 SoC SA8295,在算力、 I/O 能力等方面表现出色,不断稳固其在中高端数字座舱的稳固地位。
自动驾驶 SoC:CPU+XPU 是当前主流,英伟达当前领先
自动驾驶芯片是指可实现高级别自动驾驶的 SoC 芯片。随着自动驾驶汽车智能 化水平越来越高,需要处理的数据体量越来越大,高精地图、传感器、激光雷 达等软硬件设备对计算提出更高要求。
因此在 CPU 作为通用处理器之外,增加 具备 AI 能力的加速芯片成为主流,常见的 AI 加速芯片包括 GPU、ASIC、FPGA 三类。
CPU 作为通用处理器,适用于处理数量适中的复杂运算。CPU 作为通用处理 器,除了满足计算要求,还能处理复杂的条件和分支以及任务之间的同步协调。
CPU 芯片上需要很多空间来进行分支预测与优化,保存各种状态以降低任务切 换时的延时。这也使得它更适合逻辑控制、串行运算与通用类型数据运算。
以 GPU 与 CPU 进行比较为例,与 CPU 相比,GPU 采用了数量众多的计算单元 和超长的流水线,但只有非常简单的控制逻辑并省去了 Cache。
而 CPU 不仅 被 Cache 占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路,相比 之下计算能力只是很小的一部分。
常见的 AI 加速芯片包括 GPU、ASIC、FPGA 三类:
GPU:适用于处理数量庞大的相对简单的运算。GPU 拥有一台由数以 千计的更小、更高效的 ALU 核心组成的大规模并行计算架构。
大部分 晶体管主要用于构建控制电路和 Cache,而控制电路也相对简单,GPU 的计算速度有拥有更强大的处理浮点运算的能力,更擅长处理多重任 务,比如图形计算。
FPGA:现场可编程门阵列,它是在 PAL、GAL、CPLD 等可编程器件 的基础上进一步发展的产物。
它是作为专用集成电路领域中的一种半定 制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件 门电路数有限的缺点。
ASIC:一种为专门目的而设计的集成电路。是指应特定用户要求和特 定电子系统的需要而设计、制造的集成电路。
ASIC 的特点是面向特定 用户的需求,在批量生产时与通用集成电路相比具有体积更小、功耗更 低、可靠性提高、性能提高、保密性增强、成本降低等优点。
“CPU+XPU”是当前自动驾驶 SoC 芯片设计的主流趋势。根据 XPU 选择不 同,又可以分为三种技术路线:CPU+GPU+ASIC、CPU+ASIC 以及 CPU+FPGA 三类。
“CPU+GPU+ASIC”,主要代表英伟达、特斯拉 FSD 以及高通 Ride。 英伟达 Xavier 和特斯拉 FSD 采用“CPU+GPU+ASIC”的设计路线,英伟达 Xavier 以 GPU 为计算核心。
主要有 4 个模块:CPU、GPU、以及两个 ASIC 芯片 Deep Learning Accelerator(DLA)和 Programmable Vision Accelerator (PVA);
特斯拉 FSD 芯片以 NPU(ASIC)为计算核心,有三个主要模块:CPU、GPU 和 Neural Processing Unit(NPU)。
“CPU+ASIC”,主要代表 Mobileye EyeQ5 系列和地平线征程系列。 Mobieye EyeQ5 和地平线征程系列采用“CPU+ASIC”架构,EyeQ5 主要有 4 个模块:
CPU、Computer Vision Processors(CVP)、Deep Learning Accelerator (DLA)和 Multithreaded Accelerator(MA)
其中 CVP 是针对传统计算机视 觉算法设计的 ASIC;地平线自主设计研发了 Al 专用的 ASIC 芯片 Brain Processing Unit(BPU)。
CPU+FPGA,主要代表 Waymo。与其余厂商不同,Waymo 采用 “CPU+FPGA”的架构其计算平台采用英特尔 Xeon12 核以上 CPU,搭配 Altera 的 Arria 系列 FPGA。
目前各家发布的最新芯片平台均可以支持 L3 或 L4 级的算力需求,英伟达当前 处于领先位置。英伟达单颗 Orin 的算力可以达到 254TOPS。
而 2022 年落地 的车型中搭载 4 颗 Orin 的蔚来 ET7 和威马 M7 其巅峰算力将超过 1000TOPS, 高通骁龙 Ride 平台的巅峰算力预计在 700-760TOPS。
Mobileye 也推出了面向 高阶自动驾驶的 EyeQ6 Ultra,算力达到 176 TOPS,当前各家最先进的算力平 台均可以支持 L3 或 L4 级的算力需求。
从相关量产车型来看,英伟达 Orin 成为 当下的主流选择,Mobileye 正在逐渐掉队。评估芯片性能,算力、能耗、效率缺一不可
评估芯片的性能,一般采用 PPA 即 Power(功耗),Performance(性能), Aera(面积)三大指标来衡量性能。
而智能驾驶领域,峰值算力成为衡量自动 驾驶芯片的最主要指标,常见的指标有 TOPS、FLOPS、DMIPS 三种:
TOPS(Tera Operation Per Second):每秒完成操作的数量,乘操作算 一台 OP,加操作算一台 OP。TOPS 的物理计算单位是积累加运算(Multiply Accumulate, MAC),1 个 MAC 等于 2 个 OP。TOPS 表示每秒进行 1 万 亿次操作。
FLOPS(Floating-Point Operations Per Second):每秒可执行的浮点 运算次数的字母缩写,它用于衡量计算机浮点运算处理能力。浮点运算, 包括了所有涉及小数的运算。
MFLOPS(MegaFLOPS)等于每秒 1 百万 次的浮点运算;GFLOPS(GigaFLOPS)等于每秒 10 亿(=10^9)次的 浮点运算;TFLOPS(teraFLOPS)等于每秒 1 万亿次的浮点运算。
DMIPS(Dhrystone Million Instructions Per Second):是测量处理器 运算能力的最常见基准程序之一,常用于处理器的整型运算性能的测量。
MIPS:每秒执行百万条指令,用来计算同一秒内系统的处理能力,即每秒 执行了多少百万条指令。不同的 CPU 指令集不同、硬件加速器不同、CPU 架构不同,。
导致不能简单的用核心数和 CPU 主频来评估性能,Dhrystone 作为统一的跑分算法,DMIPS 比 MIPS 的数值更具有意义。
智能座舱 SoC: DMIPS 衡量 CPU 算力的主要单位是 DMIPS,基本上 SoC 高于 20,000 DMIPS 才能流畅地运行智能座舱的主要功能
如 AR 导航或云导航、360 全景、播放 流媒体、AR- HUD、多操作系统虚拟机等。GPU 方面,100 GFLOPS 的算力 就可以支持 3 个 720P 的屏幕。
一般来说,CPU 高于 20,000 DMIPS,GPU 高 于 100 GFLOPS 的 SoC 就是智能座舱 SoC 芯片。
自动驾驶 SoC: TOPS 峰值算力体现的只是芯片的理论上限,不能代表其全部性能。自动驾驶 需要的计算机视觉算法是基于卷积神经网络实现的。
而卷积神经网络的本质是 累积累加算法(Multiply Accumulate,MAC),实现此运算操作的硬件电路单 元,被称为“乘数累加器”。这种运算的操作,是将乘法的乘积结果 b*c 和累 加器 a 的值相加,再存入累加器 a 的操作。
TOPS = MAC 矩阵行* MAC 矩阵列 * 2 *主频,TOPS 峰值算力反映的都是 GPU 理论上的乘积累加矩阵运算算力, 而非在实际 AI 应用场景中的处理能力,具有很大的局限性。
以英伟达的芯片为 例,Orin、Xavier 的利用率基本上是 30%左右,而采用 ASIC 路线,ASIC 芯片 针对不同的神经网络模型去优化,基本上可以做到 60%~80%之间。
地平线提出最真实的 AI 效能由理论峰值计算效能、有效利用率、AI 算法效率 组成。地平线在 2020 全球人工智能和机器人峰会提出了芯片 AI 性能评估方式 MAPS(Mean Accuracy-guaranteed Precessing Speed)。
地平线认为最真实 的 AI 效能实际上由三要素组成,分别为理论峰值计算效能、有效利用率、AI 算法效率。
理论峰值计算效能,TOPS/W、TOPS/$,即传统理论峰值衡 量的方法;芯片有效利用率,把算法部署在芯片上,根据架构特点,动用 编译器等系统化解决一台极其复杂的带约束的离散优化问题。
而得到一台算法 在芯片上运行的实际利用率,这是软硬件计算架构的优化目标;AI 算法 效率,每消耗一台 TOPS 算力,能带来多少实际的 AI 算法的性能,它体现的是 AI 算法效率的持续提升。
硬件平台之二:域控制器,面向高阶自动驾驶,异构多核硬件架构成为趋势
车载计算平台需采用异构多核芯片硬件架构。自动驾驶的域控制器,要具备多 传感器融合、定位、路径规划、决策控制、无线通讯、高速通讯的能力。
通常 需要外接多个摄像头、毫米波雷达、激光雷达,以及 IMU 等设备,完成的功能 包含图像识别、数据处理等。
面向 L3 及以上高阶自动驾驶,单一芯片无法满足 诸多接口和算力需求,计算基础平台需采用异构芯片的硬件方案,具有芯片选 型灵活、可配置拓展、算力可堆砌等优点。
计算平台的异构分布硬件架构主要 包括 CPU 计算单元、AI 单元和控制单元
CPU 计算单元: 由车规级多个多核 CPU 组成,大多为 ARM 架构,单核主频高,计算能力强, 擅长处理高精度浮点数串行计算。
通过内核系统管理软硬件资源、完成任务调 度,用于执行自动驾驶相关大部分核心算法,同时整合多源数据完成路径规划、 决策控制等功能。
AI 单元: AI 单元是整个异构硬件平台中算力的最主要来源,承担大规模浮点数并行计算 需求,主流的 AI 芯片可选用 GPU、FPGA、ASIC 三种等。
通常内核系统进行 加速引擎及其他芯片资源的分配、调度。AI 单元实现对多传感器的数据高效处 理与融合,获取用于规划及决策的关键信息。
控制单元: 负责可靠性和车辆控制,功能安全和冗余监控作用,不要求很高的算力,但是 可靠性必须要有保障。基于传统车辆控制器 MCU,实现车辆动力学横纵向控制 并满足功能安全 ASIL-D 等级要求。
高性能的车载计算平台是高阶自动驾驶的必备除了异构多核的硬件架构外, 分布弹性可扩展、丰富的 I/O 接口资源、高内存带宽、车规与功能安全等也都 是高阶自动驾驶域控制器的必备特点:
硬件异构: 面向高阶自动驾驶的计算平台需兼容多类型多数量传感器,单一芯片无法满足 诸多接口和算力要求,需采用“CPU+XPU”的异构硬件方案;
分布弹性可扩展: 车载计算平台需具有弹性扩展特性以满足不同等级自动驾驶需求。针对 L3 及以 上高阶自动驾驶,随着自动驾驶等级提升,车载智能计算基础平台算力、接口 等需求都会增加。
除提高单芯片算力外,硬件单元也可复制堆叠自动驾驶操 作系统弹性适配硬件单元并可进行平滑拓展,达到整体系统提升算力、增加接 口、完善功能的目的;
丰富的 I/O 接口资源: 高阶自动驾驶的感知系统传感器种类与数量众多,车载摄像头、激光雷达、毫 米波雷达、超声波雷达、组合导航、IMU、V2X 模块等,因此丰富的接口资源 也是很自动驾驶域控制器的关键特点。
车载摄像头的数据接口一般采用 GMSL 或 FPDLink,激光雷达都是采用 Ethernet 接口,目前大多是普通 Ethernet;毫 米波雷达都是 CANFD 传输,超声波雷达采用 LIN 总线。
组合导航和惯导常见 接口为 RS232 串口,V2X 模块采用 Ethernet 接口传输。除了上述传感器所需 IO 接口外,常见的其它高速接口与低速接口比如 PCIe、USB、I2C、SPI 等;
高内存带宽: 自动驾驶芯片平台因为要接入大量的传感器数据,因此内存的压力非常大。整 个系统往往呈现出 Memory-Bound 系统的特点,因此内存带宽通常决定了系统 性能的理论上限;
车规与功能安全: 与消费级不同,车规级产品在安全性和可靠性上有更高要求。如 AEC-Q100、 ISO 26262 等,ISO 26262 对安全等级做了划分,常见的是 ASIL-B 和 ASIL-D 级别。
高性能 SoC 主芯片占整体域控制器的主要成本
当前市面上最为成熟的域控制器为特斯拉 19 年推出的 HW 3.0,特斯拉首次推 出其自研的 FSD 芯片,通过以太网总线的方式承载数据输入与以太网交换的功 能,其成本整体较为透明,通过拆解其 BOM 成本,梳理高阶自动驾驶域控制 器的成本分布。
预计 HW 3.0 板上全部芯片的成本约在 5000 元左右,外加车规级接插件、以太 网链接器以及 PCB 等外围硬件,整块板子的硬件成本大约在 7500-8500 人民 币之间。
其中,主控 SoC 芯片约占总芯片成本的 61%左右,占整体硬件成本 的 20%左右。特斯拉 HW 3.0 的主板上共搭载了两块的自研芯片。
双芯片的目 的是作为安全冗余,互相对照,每块芯片可以独立运算。每块芯片周围有四块 镁光 DRAM 内存,每块芯片分别配有一块东芝闪存芯片,用于承载操作系统和 深度学习模型。
主板的右侧是视频输出接口,从上到下依次是 FOV 摄像头、环视摄像头、A 柱 左右摄像头、B 柱左右摄像头、前视主摄像头、车内 DMS 摄像头、后摄像头、 GPS 同轴天线;
左侧是电源接口和其他另外的输入/输出接口,从上到下依次是 第二供电和 I/O 接口(车身 LIN 网络等),以太网诊断进/出、调试 USB、烧录、 主供电和 I/O(底盘 CAN 网络等)。
OEM 自研、系统集成商、软件平台商三方势力各显身手
自动驾驶域控制器玩家主要分为系统集成商、软件平台厂商以及 OEM 厂商三 大类
OEM 厂商:特斯拉以及国内的造车新势力如蔚来、小鹏、威马、理想、上汽智己等都已实现或宣布将自研自动驾驶域控制器,以掌握未来软件 定义汽车下底层的硬件自主权;
系统集成商和 Tier 1:如博世、大陆、采 埃孚等国际 Tier1 和系统集成商,德赛西威、经纬恒润、华为等一批本土 Tier1 和系统集成商;软件平台厂商:如映驰科技、东软睿驰、TTech、中科创 达等公司。
智能座舱域控制器:全球范围内,伟世通、大陆、博世、安波福在座舱域 控制器市场占据主导地位,国内企业华为、德赛西威、航盛电子、东软等也纷 纷推出了座舱域控制器解决方案。
在座舱 SoC 芯片方面,主要包括高通 820A 与 8155P、英特尔 Atom、恩智浦 i.MX8、瑞萨 R-CAR H3、德州仪器 Jacinto 系列等。
自动驾驶域控制器:全球范围内,全球 Tier1 基本都已布局自动驾驶域控 制器产品,典型产品如伟世通 DriveCore、博世 DASy、大陆集团 ADCU。
采埃 孚 ProAI、Veoneer Zeus、麦格纳 MAX4 等,国内方面,如德赛西威 IPU 系列、 经纬恒润 ADC、东软睿驰 CPDC、华为 MDC 等。
除了 OEM 厂商自研之外,OEM 厂还孵化成立独立第三方智能驾驶软件平台型 公司参与域控制器市场。此外,在域控制器市场还有一类重要的玩家,就是从 主机厂孵化成立的智能驾驶软件平台型公司。
如长城汽车的毫末知行,吉利汽 车的亿咖通等。长城汽车即将在2022年发布的新摩卡车型将搭载高通骁龙Ride 平台,相关域控制器设计与生产则是由毫末知行来实现的。
亿咖通在 2021 年 与伟世通和高通达成战略合作,为全球市场提供领先的智能座舱解决方案,此 外亿咖通在 2020 年与安谋中国合作成立芯擎科技。
2021 年 10 月国内首颗 7nm 车规级座舱芯片“龍鹰一号”流片成功,计划在 2022 年三季度实现量产,2022 年底实现前装上车。
系统软件之一:操作系统,操作系统标准与分类:车控 OS 与座舱 OS
在智能网联时代,车机操作系统 OS(operating system)按下游应用划分, 可以分为车控 OS 和座舱 OS 两大类:车控 OS:主要负责实现车辆底盘 控制、动力系统和自动驾驶,与汽车的行驶决策直接相关;
座舱 OS:主 要为车载信息娱乐服务以及车内人机交互提供控制平台,是汽车实现座舱智能 化与多源信息融合的运行环境,不直接参与汽车的行驶决策。
对于车控 OS 而言,可分为嵌入式实时操作系统 RTOS 和基于 POSIX 标准的 操作系统
嵌入式实时操作系统 RTOS:传统车控 ECU 中主控芯片 MCU 装载运行的嵌入式 OS,面向经典车辆控制领域,如动力系统、底盘系统和车身 系统等。
要求实时程序必须保证在严格的时间限制内响应,特点包括速度快, 吞吐量大,代码精简,代码规模小等;基于 POSIX 标准的操作系统:主 要面向智能驾驶系统,主要满足其高通信和低延时的要求。
汽车电控 ECU 必须是高稳定性的嵌入式实时性操作系统,主流的嵌入式实时 操作系统都兼容 OSEK/VDX 和 Classic AUTOSAR 这两类汽车电子软件标准。
嵌入式实时操作系统具有高可靠性、实时性、交互性以及多路性的优势,系统 响应极高,通常在毫秒或者微秒级别,满足了高实时性的要求。
目前,主流的 嵌入式实时操作系统都兼容 OSEK/VDX 和 Classic AUTOSAR 这两类汽车电子 软件标准。欧洲在上世纪 90 年代提出了汽车电子上分布式实时控制系统的开放式系统标 准 OSEK/VDX。
但随着技术、产品、客户需求等的升级,OSEK 标准逐渐不能 支持新的硬件平台。2003 年,宝马、博世、大陆、戴姆勒、通用、福特、标志 雪铁龙、丰田、大众 9 家企业作为核心成员,成立 AUTOSAR 组织。
致力于建 立一台标准化平台,独立于硬件的分层软件架构,制定各种车辆应用接口规范 和集成标准,AUTOSAR 是基于 OSEK/VDX 发展出来的,但涉及的范围更广。
AUTOSAR 主要包括 Classic Platform AUTOSAR(CP)和 Adaptive Platform AUTOSAR(AP)两个平台规范:CP AUTOSAR 是基于 OSEK/VDX 标准的,广泛应用于传统嵌入式 ECU 中。
如发动机控制器、电机控制器、整车 控制器、BMS 控制器等;AP AUTOSAR 基于 POSIX,主要应用于自动驾驶等 需求高计算能力、高带宽通信、分布式部署的下一代汽车应用领域中。
QNX、Linux、VxWorks 是主要的底层内核
狭义 OS 仅包含内核(如 QNX、Linux),广义 OS 从下至上包括从 BSP、操 作系统内核、中间件及库组件等硬件和上层应用之间的所有程序。
QNX、Linux 是目前常见内核 OS,VxWorks 也有一定应用。随着 WinCE 停 止更新逐渐退出,OS 内核的格局较为稳定,主要玩家为 QNX(Blackberry)、 Linux(开源基金会)、VxWorks(风河)。
其中 Linux 属于非实时操作系统, 而 QNX 和 VxWorks 属于实时操作系统,WinCE 是微软开发的嵌入式操作系统, 正在逐步退出汽车操作系统市场。
Blackberry QNX: QNX 是遵从 POSIX 规范的类 UNIX 实时操作系统,是全球第一款达到 ASIL D 级别的车载操作系统,优点是稳定性和安全性非常高。
QNX 依靠其微内核架构 实现性能和可靠性的平衡,主要特点有内核小、代码少以及故障影响小,驱动 等错误不会导致整个系统都崩溃,通用、沃尔沃、奥迪、上汽等均用 QNX 作为 自动驾驶 OS。
但缺点是 QNX 作为非开源系统,兼容性较差,开发难度大,在 娱乐系统开发中应用不多,主要是开放性不够,应用生态缺乏。
Linux(Android): Linux 是基于 POSIX 和 UNIX 的开源操作系统,可适配更多的应用场景,具有 很强的定制开发灵活度,主要用于支持更多应用和接口的信息娱乐系统场景。
Android 是谷歌基于 Linux 内核开发的开源操作系统,主要应用在车载信息娱乐 系统、导航领域,在国内车载信息娱乐系统领域占据主流地位。
由于其完全开 源,基于 Linux 开发的难度也极大,而且开发周期比较长,这就限制了车机系 统进入门槛。
VxWorks: VxWorks 由 Wind River 设计开发的嵌入式实时操作系统,以其良好的可靠性和 卓越的实时性被广泛地应用在通信、军事、航空、航天等领域。
VxWorks 由 400 多个相对独立的目标模块组成,但与 Linux 相比,VxWorks 需要收取高昂的授 权费,开发定制成本较高,这限制了其市场占有率的增长。
QNX、Linux 是当前车机 OS 内核的首选。根据赛迪顾问的统计,QNX 由于其 典型的实时性、低延时、高稳定等特征,2021 年 QNX 市占率达到 43%,是当 前市占份额最高的车机 OS。
已应用在包括宝马、奥迪、奔驰等超过 40 个牌子, 全球使用了 QNX 的汽车超 1.75 亿辆;Linux(含 Android)Linux 版本丰富, 经过改造 Linux 内核也将具备实时性功能,21 年市占率 35%;
WinCE 当前市 占率 8%,呈现快速下滑态势,未来可能将逐步在市场消失;VxWorks 同时具 备实时性及开源特点。
但其业务重点一直在复杂工业领域,对于汽车产业投入 较少,售价及维修费用极其昂贵,目前仅在部分高端牌子车型上有所尝试。
QNX+Linux 或 QNX+Android 是当前的主流趋势
随着智能座舱和智能驾驶的进步,OEM 厂商更加关注车机 OS。然而,无论是 传统 OEM 巨头或是造车新势力,从零开始开发操作系统都绝非易事,根据对 基础系统的改造程度不同,一般可以分为三类:
定制型车机 OS:在基础 OS 的基础上进行深度开发和定制(包括系统内 核修改),与 Tier1 和主机厂一起实现座舱系统平台或自动驾驶系统平台。例 如百度车载 OS、大众 VW.OS、特斯拉 Version;
ROM 型车机 OS:基于 Android 或 Linux 定制开发,无需更改系统内核。 海外主机厂多选择基于 Linux 开发 ROM 型车机 OS。
国内自主牌子则主要选择 应用生态更好的 Android。例如奔驰、宝马、蔚来、小鹏等整车厂的车机系统都 属于 ROM 型车机 OS;
超级汽车 APP:并非完整的车机 OS,而是手机映射系统,是指集地图、音乐、语音、社交等功能于一体的多功能 APP,满足车主需求。例如百度 Carlife、 华为 HiCar、苹果 CarPlay、谷歌 AndroidAuto 等。
QNX+Linux 或者是 QNX+Android 是当前智能驾驶 OS+智能座舱 OS 的主要 选择。当前 QNX、Linux(包含 Android)仍是 OS 底层内核的主要选择。
无论 是智能驾驶 OS 或是智能座舱 OS 基本都会采用 QNX+Linux 或者是 QNX+Android 的组合方式。
以 QNX 为代表的实时操作系统主要用在驾驶 OS 上,由于应用生态上较为薄弱,当前座舱 OS 主流是 Android 以及基于 Linux 系统的定制型及 ROM 型系统。
系统软件之二:硬件抽象层与中间件层,硬件抽象层之一 BSP:主板硬件与操作系统之间的桥梁
BSP(Board Support Package,板级支持包)是构建嵌入式操作系统所需的 引导程序、内核、根文件系统和工具链提供的完整的软件资源包。
对于具体的 硬件平台,与硬件相关的代码都被封装在 BSP 中,由 BSP 向上提供虚拟的硬 件平台,BSP 与操作系统通过定义好的接口进行交互。
BSP 介于主板硬件和操作系统之间的一层,也属于操作系统的一部分,主要目 的是为了支持操作系统,使之能够更好的运行于硬件主板,为 OS 和硬件设备 的交互操作搭建了一台桥梁
由于所属的中介位置,BSP 的功能分为两部分, 一方面为 OS 及上层应用程序提供一台与硬件无关的软件平台,另一方面 OS 可以通过 BSP 来完成对指定硬件的配置和管理。
不同的操作系统对应于不同定义形式的 BSP。例如,VxWorks 的 BSP 和 Linux 的 BSP 相对于某一 CPU 来说尽管实现的功能一样,但写法和接口定义是完全 不同的。
所以写 BSP 一定要按照该系统 BSP 的定义形式来写,这样才能与上 层 OS 保持正确的接口,良好的支持上层 OS。
硬件抽象层之二 Hypervisor:虚拟化平台,跨平台应用的重要途径
提供平台虚拟化的层称为 Hypervisor。虚拟化是通过某种方式隐藏底层物理硬 件的过程,从而实现多个操作系统可以透明地使用和共享硬件。
Hypervisor 是 实现跨平台应用、提高硬件利用率的重要途径。车载领域的 Hypervisor 负责管 理并虚拟化异构硬件资源,以提供给运行在 Hypervisor 之上的多个操作系统内 核。
Hypervisor 支持异构硬件单元(包括控制单元、计算单元、AI 单元)的隔 离,在同一台异构硬件平台上支持不同的操作系统内核,从而支持不同种类的 应用。
Hypervisor 虚拟机管理助力多系统融合。Hypervisor(虚拟机)是运行在物理 服务器和操作系统之间的中间软件层,可用于同步支持 Android、Linux、 QNX多系统。
根据 ISO26262 标准规定,仪表盘的关键数据和代码与娱乐信息系统 属于不同等级,主流市场中,QNX 或 Linux 系统用来驱动仪表系统,信息娱乐 系统则以 Android 为主。
目前技术只能将两个系统分开装置在各自芯片中。然 而,虚拟机可以同时运作符合车规安全标准的 QNX 与 Linux,因此虚拟机管理 的概念被引入智能座舱操作系统。
随着液晶仪表以及其他安全功能的普及,供应商不需要装载多个硬件来实现不 同的功能需求,只需要在车载主芯片上进行虚拟化的软件配置,形成多个虚拟 机。
在每个虚拟机上运行相应的软件即可满足需求。引入虚拟机管理最重要的 意义在于虚拟机可以提供一台同时运行两个及以上独立操作系统的环境。
比如 在智能座舱中同时运行 Android(座舱 OS)和 QNX(车控 OS),为智能网联 汽车的应用提供高性价比且符合安全要求的平台。
QNX Hypervisor是当前市场的主流
目前常见的Hypervisor包括黑莓的QNX、 英特尔与 Linux 主导的 ACRN、Mobica 为代表的 XEN、松下收购的 Open Synergy 的 COQOS、德国大陆汽车的 L4RE,法国 VOSyS 的 VOSySmonitor 等。
其中最主流的是黑莓的 QNX 与英特尔与 Linux 主导的 ACRN,其中黑莓的 QNX 是目前唯一被大规模商用且安全等级达到 ASIL D 级的虚拟化操作系统。
中科创达、武汉光庭信息、南京诚迈科技是黑莓 VAI 项目的系统集成商类的合 作伙伴。2017 年 3 月,黑莓公司宣布正式成立 VAI(Value-Added Integrator) 项目。
拓展嵌入式软件市场,成为黑莓公司 VAI 项目合作伙伴,将基于黑莓的 嵌入式技术提供集成服务、安全关键型解决方案。
包括黑莓 QNX Neutrino 实 时操作系统、QNX Momentics 工具套件、QNX 管理程序、应用程序和媒体 QNX SDK、QNX 无线架构。
QNX 认证操作系统、QNX 医用操作系统、Certicom 工具包、Certicom 管理的公钥基础设施以及 Certicom 资产管理系统。
目前, 黑莓 VAI 项目的中国区系统集成商类的合作伙伴主要包括中科创达、武汉光庭 信息、南京诚迈科技等。
长期看,智能座舱与自动驾驶两大系统终将走向融合。由于目前车控域与座舱 域两者的发展目标平行,同时,由于 QNX、Linux 与 Andriod 三大系统各有优劣。
因此,通过虚拟机管理多个独立系统是当下实现“多快好省”的智能网联 汽车的发展路径。但从长期看,想要真正实现高级自动驾驶的必要前提就是车 控与座舱的融合。
即智能座舱与自动驾驶系统的容二虎,这样将会从整体层面 给未来留下更系统的升级空间。当然两大系统的融合也面临着系统叠加导致的 片负载加重,对计算性能形成挑战。
中间件层:助力软硬件解耦分离,提升应用层开发效率
中间件隔离应用层与底层硬件,助力软硬件解耦。中间件位于操作系统、网络 和数据库之上,应用软件的下层,作用是为处于自个上层的应用软件提供运行 与开发的环境。帮助用户灵活、高效地开发和集成复杂的应用软件,实现软硬 件的解耦分离。
车企致力于定义更统一的中间件通信和服务,以降低开发成本 和系统复杂度,操作软件(OS)和中间件是促进软硬件分离的底层软件组件。
即使车企选择自研操作系统,但同时也会依赖于供应商提供标准中间件产品, 尤其基础软件平台的架构极其重要,可大幅提升应用层软件的开发效率。
所有中间件方案中,最著名的是 CP AUTOSAR 的 RTE。AUTOSAR 的两个平 台 AUTOSAR Classic 和 AUTOSAR Adaptive 为不同的车辆用例提供了分层的 软件体系结构方法。
AUTOSAR 以中间件 RTE(Runtime Environment)为界, 隔离上层的应用层(Application Layer)与下层的基础软件(Basic Software)。
RTE 使得硬件层完全独立于应用层,OEM 厂商可以专注于开发特定的、有竞 争力的应用软件,同时使得厂商不关心的基础软件层被标准化。
分布式通信(Data Distribution Service, DDS)通过实现低延迟数据链接、极 高的可靠性和可扩展的灵活架构,使数据成为未来移动数字平台的中心。
DDS 提供的用于以数据为中心的链接的中间件协议、链接框架和 API 标准。它集成 了分布式系统的组件,提供了低延迟的数据链接、极高的可靠性和可扩展的体 系结构,满足业务和任务关键型应用程序的需求。
AUTOSAR Adaptive 平台 2017 年推出,2018 年便集成了 DDS 标准,将 DDS 与 AUTOSAR 结合使用, 不仅可以保证和扩展 AUTOSAR 系统内部互操作性的功能,而且还可以将其开 放给来自不同生态系统等行业的外部系统。
国产 AUTOSAR 供应商不断崛起。AUTOSAR 标准发展了十多年,已经形成非 常复杂的技术体系。各工具厂商开发了相应的支撑软件,以助力主机厂加速实 现 AUTOSAR 的落地。
目前全球知名的 AUTOSAR 解决方案厂商包括 ETAS(博 世)、EB(大陆)、Mentor Graphics(西门子)、Wind River、Vector、KPIT 等,国内主要是东软睿驰、经纬恒润等。
功能软件、工具链及应用软件:功能软件:自动驾驶的核心共性功能模块
功能软件主要包含自动驾驶的核心共性功能模块。核心共性功能模块包括自动 驾驶通用框架、网联、云控等,结合系统软件,共同构成完整的自动驾驶操作 系统,支撑自动驾驶技术实现。
智能驾驶通用模型: 智能驾驶通用模型是对智能驾驶中智能认知、智能决策和智能控制等过程的模 型化抽象。对应于自动驾驶中环境感知、决策与规划、控制与执行三大部分。
通用模型也可以分为环境模型、规划模型和控制模型等。自动驾驶会产生安全 和产品化共性需求,通过设计和实现通用框架模块来满足这些共性需求,是保 障自动驾驶系统实时、安全、可扩展和可定制的基础。
功能软件通用框架: 功能软件通用框架是承载智能驾驶通用模型的基础,是功能软件的核心和驱动 部分,可以分为数据流框架和基础服务两部分。
数据流框架向下封装不同的智能驾驶系统软件和中间件服务,向智能驾驶 通用模型中的算法提供与底层系统软件解耦的算法框架。
数据流框架的主 要作用是对智能驾驶通用模型中的算法进行抽象、部署、驱动,解决跨域、 跨平台部署和计算的问题。
基础服务是功能软件层共用的基本服务,包括可靠冗余组件、信息安全基 本服务以及网联云控服务等。其中,可靠冗余组件是保证自动驾驶安全可 控的关键,也是车控操作系统取得操作系统全栈功能安全认证的重要保障;
信息安全基础服务为车端数据定义了数据类型和安全等级,为车端功能和 应用定义的数据处理功能定义;网联云控服务可提供操作系统的安全冗余 信息、超视距信息和通用模型的信息。
数据抽象: 数据抽象可以为上层各模型提供数据源。通过对传感器、执行器、自车状态、 地图以及来自云端的接口等数据进行标准化处理
数据抽象的过程可以为智能 驾驶通用模型提供各种不同的数据源进而建立异构硬件数据抽象
达到功能和 应用开发与底层硬件的解耦和依赖。一般来说,数据抽象可以分为分类、聚集与概括三种类型。
工具链:提升平台软硬件研发效率的重要途径
车载计算平台开发的软硬件环境以及全栈工具链成为提升开发效率的重要途径 之一。高阶自动驾驶技术不断迭代,车载计算平台的研发更需要对产品进行整 体持续的迭代。
而不只是针对单一的模块,或者其中几个功能。全栈式工具链 主要包括开发工具、集成工具、仿真工具、调试工具、测试工具等。
应用软件:OEM 牌子智能化产品力的直接体现
应用软件作为系统软件与功能软件之上独立开发的软件程序,更是 OEM 牌子 智能化产品力的直接体现。应用软件主要包括面向自动驾驶算法、地图导航类、车载语音、OTA 与云服务、信息娱乐等。
自动驾驶算法
自动驾驶算法是决定车辆智能化水平的关键所在。自动驾驶算法覆盖感知、决 策、执行三个层次。感知类算法。
SLAM(Simultaneous localization and mapping,同步定位与建图)。算法是一台重要分支,SLAM 算法根据点云数据 传感器的不同。
又可分为视觉 SLAM 算法、激光 SLAM 算法以及多传感器融合算 法;决策类算法包括自动驾驶规划算法、自动驾驶决策算法;执行类算法主要 为自动驾驶控制算法。
高精度地图
高精度地图,即 HD Map(High Definition Map)或 HAD Map(Highly Automated Driving Map),是指绝对精度和相对精度均在 1 米以内的高精度、 高新鲜度、高丰富度的电子地图。
其信息包括道路类型、曲率、车道线位置等 道路信息,路边基础设施、障碍物、交通标志等环境对象信息,以及交通流量、 红绿灯状态信息等实时动态信息。
高精度地图是实现高度自动化驾驶的必要条件,是 L3 及以上级别的自动驾驶汽车的必备选项。
高精度地图可有效弥补传感器的性能边界,提供重要的先验 信息,是实现高度自动化驾驶甚至无人驾驶的必要条件,也是未来车路协同的 重要载体。
百度、四维图新、高德占据主要份额,国内市场呈现“三足鼎立”。由于地图 导航类业务的资质限制,国内高精度地图主要玩家大多是本土公司。
根据 IDC 统计,2020 年国内高精度地图行业市场份额前五名公司为百度、四维图新、高德易图通以及 Here,其中 CR3 超过 65%,呈现“三足鼎立”的局面。
预计 2025 年国内市场规模达 32 亿美元。按照 3 亿辆汽车保有量及单车百元年 服务费测算,国内市场规模将从 2020 年的 6.4 亿美元增长到 2025 年的 32 亿 美元,预计 2025 年全球市场份额将达到 35.6%,CAGR 达到 38.0%,高于同 期全球增速。 |