电子发烧友网报道(文/李弯弯)车载计算平台是智能网联汽车的核心部件,承担着车辆感知、决策、控制等关键任务,相当于汽车的“大脑”。随着汽车智能化和自动驾驶技术的发展,车载计算平台的重要性日益凸显,其性能直接决定了自动驾驶的等级和安全性。
车载计算平台的核心功能:感知与融合,通过摄像头、激光雷达、毫米波雷达、超声波雷达等传感器获取环境信息,并对多源数据进行融合处理,实现对车辆周围环境的精准感知;决策与规划,基于感知数据,进行路径规划、行为决策(如变道、超车、避障等),并生成控制指令;控制与执行,将决策结果转化为具体的控制信号,控制车辆的转向、加速、制动等执行机构,实现自动驾驶功能;通信与网联,支持车与车(V2V)、车与基础设施(V2I)、车与云端(V2C)的通信,实现信息共享和协同控制。
车载计算平台的技术架构——硬件和软件
车载计算平台的硬件架构需满足高算力、低功耗和冗余安全的需求,通常采用异构计算单元和高带宽通信的组合。
异构计算单元包括CPU、GPU、FPGA、ASIC、NPU等。CPU,负责通用计算任务,如系统调度、通信协议处理等。通常采用多核ARM架构(如高通骁龙、瑞萨R-Car),兼顾性能与功耗。GPU,擅长并行计算,加速深度学习模型推理(如目标检测、语义分割),NVIDIA Orin、特斯拉FSD等芯片集成高性能GPU。
FPGA,可编程硬件,灵活适配算法优化,常用于传感器数据预处理或低延迟任务。ASIC,针对特定算法(如Transformer模型)定制化设计,提供极致能效比(如特斯拉FSD芯片)。NPU,专为AI计算优化,支持高吞吐量的矩阵运算,是当前主流AI芯片的核心组件。
高带宽通信包括车载以太网、PCIe接口、TSN(时间敏感网络)等。车载以太网,支持1Gbps甚至10Gbps传输速率,替代传统CAN总线,满足传感器数据的实时传输需求。PCIe接口,连接GPU、FPGA等加速卡,提供低延迟、高带宽的扩展能力。TSN(时间敏感网络),确保关键任务(如制动控制)的确定性时延,避免网络拥塞导致的安全隐患。
冗余与安全设计,如双系统冗余、硬件安全模块(HSM)、隔离设计等。双系统冗余,主计算单元与备份单元并行运行,故障时无缝切换(如英伟达DRIVE AGX Orin支持双Orin芯片冗余)。硬件安全模块(HSM),独立芯片存储密钥和加密算法,防止数据篡改或恶意攻击。隔离设计,通过虚拟化技术将安全关键任务与非关键任务隔离。
软件架构需支持多任务并行、低延迟通信和持续迭代,通常采用分层解耦的设计模式。
操作系统层,如实时操作系统(RTOS)、通用操作系统(GPOS)、混合架构。实时操作系统(RTOS),如QNX、VxWorks,用于安全关键任务(如刹车控制),确保毫秒级响应。通用操作系统(GPOS),如Linux、Android,用于非关键任务(如导航、娱乐),支持丰富的应用生态。混合架构,通过Hypervisor(如ACRN、KVM)实现RTOS与GPOS的协同运行,兼顾安全与灵活性。
中间件层,包括通信中间件、调度中间件、安全中间件。通信中间件,如SOME/IP、DDS,支持服务发现、数据分发和QoS控制,实现模块间高效通信。调度中间件,如AUTOSAR Adaptive Platform,动态分配计算资源,优化任务时序。安全中间件,集成加密库、入侵检测系统(IDS),保障数据传输和存储安全。
应用算法层,如感知算法、决策算法、控制算法。感知算法,包括摄像头视觉处理(如YOLO、Faster R-CNN)、激光雷达点云分割(如PointPillars)、多传感器融合(如卡尔曼滤波)。决策算法,基于规则的决策树(如有限状态机FSM)或基于学习的强化学习(如DQN),生成行驶策略。控制算法。模型预测控制(MPC)、PID控制等,将决策转化为具体的车辆控制指令。
典型技术架构,以NVIDIA DRIVE AGX为例。硬件:双Orin芯片(算力508TOPS),集成Ampere架构GPU、Arm Cortex-A78AE CPU、深度学习加速器(DLA)。软件:底层是Linux + 安全内核(符合ISO 26262 ASIL-D);中间件是NVIDIA DRIVE OS(集成CUDA、TensorRT);应用层是DRIVE AV(自动驾驶)、DRIVE IX(智能座舱)。通信:支持PCIe Gen4、10G以太网、CAN-FD。
车载计算平台芯片——SoC
目前市面上主要的车载计算平台SoC芯片有英伟达Orin系列、华为昇腾系列、地平线征程系列、黑芝麻智能华山系列、高通骁龙Ride平台、特斯拉FSD芯片等。
英伟达Orin系列,单颗芯片算力可达254TOPS,多颗组合可支持更高算力需求,如蔚来ET7和威马M7搭载4颗Orin芯片,巅峰算力超过1000TOPS。其采用“CPU+GPU+ASIC”架构,适用于L3或L4级自动驾驶。
华为昇腾系列,包括昇腾310、昇腾610等,具有强大的AI计算能力,功能安全等级达到ASIL-D。昇腾610芯片在CPU、CV处理能力及内存带宽方面业界领先,适用于自动驾驶应用负载。
地平线征程系列,包括征程2、征程3、征程5、征程6等,算力不断提升,满足不同等级自动驾驶需求。2025年4月18日,地平线征程6系列的旗舰产品征程6P(J6P)、征程6H(J6H)正式亮相,同时,基于J6P芯片和地平线自研端到端算法的软硬一体全栈方案HSD(Horizon Super Driving)也一并推出,具备L2城区辅助驾驶能力。
J6P基于地平线最新的BPU“纳什”架构,采用CPU+GPU+NPU+MCU+VPU的异构设计,具备三级存储架构和数据变换引擎,专为Transformer、BEV等大模型优化。
黑芝麻智能华山系列,包括A500、A1000L、A1000、A1000 Pro以及A2000家族。基于A1000芯片,可提供单颗、双颗、四颗芯片的组合方案,算力覆盖从ADAS辅助驾驶到L4及以上自动驾驶需求。
2024年12月30日,黑芝麻智能宣布推出其专为下一代AI模型设计的高算力芯片平台——华山A2000家族,包括A2000 Lite、A2000和A2000 Pro三款产品,分别针对不同等级的自动驾驶需求。A2000 Lite专注于城市智驾,A2000支持全场景通识智驾,而A2000 Pro则是为高阶全场景通识智驾设计。
A2000家族的芯片集成了业界领先的CPU、DSP、GPU、NPU、MCU、ISP和CV等多功能单元,实现了高度集成化和单芯片多任务处理的能力。新一代ISP技术,具备4帧曝光和150dB HDR,在隧道和夜间等场景下表现更好,显著提升了图像处理能力。A2000家族算力最大是当前主流旗舰芯片的4倍,原生支持Transformer模型。
高通骁龙Ride平台,巅峰算力预计在700-760TOPS,采用“CPU+GPU+ASIC”架构,为自动驾驶、ADAS、车载信息娱乐系统等领域提供强大的计算能力。
Mobileye EyeQ系列,如EyeQ6 Ultra,算力达到176TOPS,采用“CPU+ASIC”架构,为高阶自动驾驶提供支持。不过,Mobileye在市场竞争中逐渐掉队。
特斯拉FSD芯片,以NPU(ASIC)为计算核心,有三个主要模块:CPU、GPU和Neural Processing Unit(NPU),总算力达到144TOPS,已广泛用于特斯拉车型。
写在最后
车载计算平台的技术架构是硬件、软件和系统集成的综合体现,其核心在于异构计算的高效协同、实时性与安全性的平衡以及全生命周期的可持续性。SoC内部集成多个异构处理单元,结构设计复杂,处理和计算能力强,适用于多任务处理以及计算任务复杂的应用场景。随着汽车智能化程度的提高,对高性能SoC芯片的需求也将不断提升。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
soc
+关注
关注
40文章
4665浏览量
230734 -
异构设计
+关注
关注
0文章
3浏览量
5606
发布评论请先 登录
相关推荐
热点推荐
是否有方法可以实现从 GPU (OpenCL) 到 NPU 的零拷贝数据传输?
Hi,
我正在为 i.MX 8M Plus 开发管道,我想知道是否有任何方法可以实现从 GPU (OpenCL) 到 NPU 的零拷贝数据传输。
我遇到过 NNStreamer,它似乎支持
发表于 05-28 08:19
CPU、GPU、NPU到底有什么区别? 嵌入式/工控/选型一次讲透!!
CPU、GPU、NPU到底有什么区别?嵌入式/工控/选型一次讲透做嵌入式开发、折腾工控板、调试端侧AI的朋友,几乎都纠结过同一个问题:同样是芯片,为什么有的板子胜在CPU稳定、有的赢在
基于openEuler平台的CPU、GPU与FPGA异构加速实战
随着 AI、视频处理、加密和高性能计算需求的增长,单一 CPU 已无法满足低延迟、高吞吐量的计算需求。openEuler 作为面向企业和云端的开源操作系统,在 多样算力支持 方面表现出色,能够高效调度
请问在哪里可以找到 VisionFive 2 上的 VPU?
/building_starfive_debian_image, VPU驱动程序是要建造的。但是,它不应该带有相应的物理硬件吗?
在这个VisionFive 2 规范,没有任何地方提到VPU,但只有一个JH7110 处理器 + 想象力G
发表于 02-11 08:17
GPU 利用率<30%?这款开源智算云平台让算力不浪费 1%
作为 AI 开发者,你是否早已受够这些困境:花数百万采购的 GPU 集群,利用率常年低于 30%,算力闲置如同烧钱;跨 CPU/GPU/NPU 异构
AI硬件全景解析:CPU、GPU、NPU、TPU的差异化之路,一文看懂!
CPU作为“通用基石”,支撑所有设备的基础运行;GPU凭借并行算力,成为AI训练与图形处理的“主力”;TPU在Google生态中深耕云端大模型训练;NPU则让AI从“云端”走向“身边”(手机、手表
从CPU、GPU到NPU,美格智能持续优化异构算力计算效能
的科技企业也在近期表示,将通过软件层创新大幅提升算力资源利用率。作为高算力AI模组和端侧AI领域的领先企业,美格智能长期专注于端侧AI算力的优化与提升,通过深耕SoC架
蜂鸟内核VPU模块设计分享
本项目在VPU部分添加了一个应用于嵌入式的轻量级向量协处理器,实现了部分的V型计算功能,满足本情景下的使用要求。VPU和CPU之间有五个接口的数据交互,交互有握手的协议进行控制。接口分
发表于 10-23 06:02
车载360环视平台:米尔RK3576开发板支持12路低延迟推流
采用 8nm 工艺,搭载 四核 Cortex-A72 + 四核 Cortex-A53,配合 Mali-G52 GPU 与 6TOPS NPU,为车载环视提供充足的算力与扩展空间。12
发表于 10-11 17:55
360环视硬件平台为什么推荐使用米尔RK3576开发板?
接收端解码显示,端到端延迟约 120~150ms(编码侧 80~100ms + 传输/解码 40~50ms),满足车载与安防对实时性的要求。资源均衡与稳定可靠:RGA、VPU、CPU、GPU
发表于 09-19 17:38
12路1080P高清视频流,米尔RK3576 开发板赋能车载360环视
在智能视觉技术不断发展的今天,多路摄像数据的处理与传输已成为众多应用场景的核心需求。从智能安防监控领域的全面覆盖,到工业视觉处理网关的精准检测,再到车载环视融合平台的实时驾驶辅助以及智慧社区AI防
发表于 08-14 14:01
异构计算解决方案(兼容不同硬件架构)
异构计算解决方案通过整合不同类型处理器(如CPU、GPU、NPU、FPGA等),实现硬件资源的高效协同与兼容,满足多样化计算需求。其核心技术
如何释放异构计算的潜能?Imagination与Baya Systems的系统架构实践启示
查看完整报告。你是否正在设计多核或CPU/GPU混合系统,却依然未能达成性能目标?你并不孤单。如今,系统架构师们不断追求构建更强大的SoC,过于专注于计算能力的“
车载计算平台SoC:采用CPU+GPU+NPU+MCU+VPU异构设计
评论