0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

行业观察——边缘AI芯片架构的思考:为何可扩展GPU架构值得关注

互联网资讯 来源:北京华兴万邦管理咨询有 作者:北京华兴万邦管理 2025-04-18 09:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:北京华兴万邦管理咨询有限公司 翔煜 商瑞

随着大模型在不断演进的同时将推理应用大规模推向边缘和端点设备,以及物联网智化、具身智能、AI智能体(AI Agent)和物理AI等新的AI应用场景和模式的快速涌现,AI赋能设备的主控芯片设计师正面临着全新的挑战。尤其是对于边缘和端点设备,它们既可能成为大模型的承载设备,也可能是用智能去为应用提供更好的核心功能,新的产品定义方向使主芯片架构师不得不去思考,其芯片在如何应对大模型快速演进的同时,还能实现用智能手段赋能传统应用和实现新兴功能。

因此,在追求极致性能、功耗和面积(PPA)的模式之外,架构师们需要富有前瞻性地去选择高性能、高灵活性、可升级和开发者(生态)友好的架构。我们不妨先回顾AI发展的历程,从感知AI到生成式AI,再到智能体AI和物理AI,其应用场景不断拓展。在感知AI阶段,Al技术在语音识别、深度推荐系统和医学影像等领域取得显著进展;生成式AI在数字营销和内容创作方面发挥了重要作用;智能体AI为编程、客户服务、患者护理提供助力;物理AI推动了自动驾驶汽车和通用机器人发展。

wKgZO2gA73OAWmsjAASaugnydGA085.png

伴随着AI技术的发展,在传统的CPUGPUFPGA等计算技术之外,诸如TPU、NPU 和DPU等专门针对特定算法或者模型的新型硬件数据处理加速器也开始出现,它们带来高效率因而在许多场景中得到了应用。与此同时,AI技术不断向新的场景和应用广泛渗透,使得面向特定模型和场景的NPU等架构难以应对模型的变化和场景的多样化,从而使传统的 灵活性更高的CPU和GPU架构依旧在计算领域占据重要地位。

但是,AI技术的进步和新场景的出现,正在迫使半导体知识产权(IP)提供商和芯片设计公司快速做出变化,无论是采用传统架构的厂商,还是新的xPU提供商都需要尊重产业规律。华兴万邦亦认为,从技术经济学和企业实际经营来看,高额的研发费用和市场营销费用是多数芯片设计企业面临的最重要费用,而灵活可扩展的架构可以覆盖更广的市场并可以实现更长的产品生命周期,它们是摊销这些费用以提升盈利能力的重要手段。

架构创新迫在眉睫

Imagination Technologies中国业务发展负责人黄音在慕尼黑电子展AI技术创新论坛演讲中分析道:“当前主芯片设计不仅需要芯片企业投入大量研发资源,更需要协调生态合作伙伴的技术路线。面对AI算法快速迭代的挑战,行业在探索创新架构的同时,仍需重视经过长期验证的基础计算架构价值。以GPU为例,其架构在保持高并行计算优势的同时,新一代设计正通过模块化扩展能力(如可配置Shader集群、弹性内存子系统)来适应不同AI工作负载需求。作为专注图形计算领域的IP厂商,Imagination观察到,理想的AI加速架构需要在三个维度取得平衡:支持细粒度并行的计算单元设计、满足算法动态调整的可配置性,以及维持开发工具链的持续兼容性。”

wKgZO2gA73GAeQkGAAiK6llNXSE700.png

“扩展能力是Imagination GPU开发演进的方向:在具备强大的渲染能力的同时,融合AI并行计算能力,在边缘AI的场景下能提供灵活又高效的算力。所以,Imagination将帮助芯片设计人员发现真正的破局点,帮助他们去构建一个可以持续适配模型和算法演进、以及支持新兴应用的架构平台——而不是为某个模型做一次性的‘专用硬件定制’,从而避免硬件(处理器)总是费力费钱跟着算法跑的问题。”黄音补充道。

Imagination正在帮助客户导入更加灵活的架构。以该公司不久前发布的Imagination DXTP GPU IP为例,它采用了先进的平衡架构,增加了缓存和系统级带宽,实现了更高的持续性能,几何吞吐量提高50%,不仅能够轻松同时处理图形和计算任务,而且其功率效率还较其前序产品提升了20%,为边缘AI提供了理想的GPU平台。DXTP GPU已经被全球知名科技公司采用,用于对AI 多数据类型处理、计算任务加速和本地内存的支持。

wKgZPGgA73CAHuMCAAKIutK_0Zs823.png

三个落地是成功的关键

当然,对于芯片设计师而言,这需要做到三个必须“落地”,即模型算法落地、垂直功能落地和开放生态落地。针对模型算法落地,Imagination的突破点是坚持构建一个通用可编程的并行架构平台,并通过开放的编译器和推理后端(backend),支持客户软硬件协同设计和提供适配路径,帮助其客户把诸如Transformer、Diffusion类模型和前沿算法快速落地到GPU上。为此该公司将帮助客户认识到在算法不断演化的时代,架构的“适配力”远比一时的TOPS值更重要。

在垂直功能落地方面,Imagination在移动、汽车、云和桌面等领域深耕了数十年,积累了丰富的经验和许多创新的支撑性技术,可以帮助客户去避开其中的潜在风险和快速在领域内创造优势,这可以从该公司的D系列GPU IP的产品功能创新上可以看出其垂直领域功能落地能力。例如,DXT GPU是Imagination面向移动应用、高端游戏和专业图形设计等应用推出的新一代GPU IP,它不仅率先在移动平台上提供了可扩展的光线追踪功能,还有2D双速率纹理映射等多项可以提升处理速度和优化内存带宽的技术。

为了帮助桌面和数据中心客户实现高性能的云端GPU创新解决方案,Imagination推出了DXD GPU IP,首次将Imagination的API覆盖扩展至DirectX,这一举措显著提升了DXD与Windows平台上的应用程序和游戏的兼容性。同时,Imagination的硬件虚拟化技术 HyperLane支持在单个GPU上安全且独立地运行多个操作系统,极大地提升了服务器的使用效率,降低了云游戏的运营成本,并为云游戏行业的发展带来了创新的运营模式。

Imagination为汽车智驾芯片提供的专用IP是该公司支持芯片设计企业垂直功能落地的又一个典范,血的教训换来了更加严格的安全法规,使智驾芯片设计公司在算力、生态和生命周期之外,必须去认真去考虑功能安全性。为了帮助芯片设计企业满足全球汽车智能化需求,Imagination推出了DXS系列GPU,该系列IP不仅为智能驾驶舱和先进驾驶辅助(ADAS)等应用所需SoC带来匹配的算力,而且专为诸如汽车处理器等对功能安全性要求极为严苛的应用,开发了结合GPU的计算模式特点并大幅降低成本的分布式功能安全机制(DSM)并通过了ASIL-B认证。这为汽车和工业等越来越多需要GPU的图形处理能力和计算能力的电子系统带来了巨大的创新。

wKgZO2gA73GAANXqAALQdVGW_JY138.png

Imagination在支持客户实现产业生态落地方面也同样颇费心机,其GPU IP全面支持OpenCL、SYCL、Vulkan Compute等开放标准,与PyTorch、TensorFlow等主流框架完美兼容。如Imagination通过与安卓生态系统合作,优化对LiteRT的支持,为开发者提供丰富工具和示例,便于开发高性能AI应用,充分展现了其GPU架构的适配能力。这种开放生态简化了新硬件与设备的集成流程,避免供应商锁定问题,使客户能在不同平台轻松部署。通过整合多方资源,Imagination可帮助客户实现协同优化,提升资源利用率和执行效率,巩固了其在GPU市场的领先地位,为企业应对AI算法和产品快速迭代提供坚实支持。

总结与展望

大模型的下沉、算法创新和边缘及端侧AI的崛起为基于 GPU的主控芯片带来了新的发展契机,在AI一体机、新物联网、智能安防和自动驾驶等领域已经出现了巨大的需求,这些设备对高性能的图形处理和AI推理同时都有越来越多的需求,因此更灵活和可扩展的架构可以使芯片设计公司的产品覆盖更广泛的市场领域,同时可以拥有更长的产品生命周期,也就有了更高的潜在盈利能力。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5101

    浏览量

    134479
  • AI
    AI
    +关注

    关注

    89

    文章

    38176

    浏览量

    296936
  • AI芯片
    +关注

    关注

    17

    文章

    2068

    浏览量

    36580
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    建立的基础: ①算力支柱②数据支柱③计算支柱 1)算力 与AI算力有关的因素: ①晶体管数量②晶体管速度③芯片架构芯片面积⑤制造工艺⑥芯片
    发表于 09-18 15:31

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 36次下载

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    算法 5.2加速矩阵乘法的芯片架构 ①新的矩阵乘法器架构 ②基于RISC-V的矩阵乘法扩展指令集 ③用信息论的思想来减少AI推理计算量 三、
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    ②Transformer引擎③NVLink Switch系统④机密计算⑤HBM FPGA: 架构的主要特点:重构逻辑和路由,可以快速实现各种不同形式的神经网络加速。 ASIC: 介绍了几种ASIC AI
    发表于 09-12 16:07

    AI 芯片浪潮下,职场晋升新契机?

    职场、渴望在专业领域更进一步的人来说,AI 芯片与职称评审之间,实则有着千丝万缕的联系,为职业晋升开辟了新的路径。 AI 芯片领域细分与职称对应 目前,
    发表于 08-19 08:58

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了
    发表于 06-18 19:31

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 1344次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析

    又一颗国产GPU芯片成功点亮!6nm制程,自研TrueGPU架构

    GPU芯片G100采用6nm制程,基于自研的TrueGPU架构,这是全球首个融合高性能图形渲染与AI推理能力的GPU
    发表于 05-29 00:48 2423次阅读

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能强 iTOP-3588S开发板采用瑞芯微RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 05-15 10:36

    RK3588核心板在边缘AI计算中的颠覆性优势与场景落地

    推理任务,需额外部署GPU加速卡,导致成本与功耗飙升。 扩展性受限:老旧接口(如USB 2.0、百兆网口)无法支持5G模组、高速存储等现代外设,升级困难。 开发周期长:BSP适配不完善,跨平台AI
    发表于 04-15 10:48

    北京市最值得去的十家半导体芯片公司

    代提升2-3倍,广泛应用于云计算与边缘计算,2021年独立后估值达130亿元。 5. 奕斯伟(ESWIN) 领域 :RISC-V架构与生态链 亮点 :聚焦RISC-V+AI芯片,覆盖计
    发表于 03-05 19:37

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的三重革命1) 硬件架构革命:英特尔IPU路线图显示,到2026年将推出FPGA+Xeon的异构加速卡;AMD计划2023年集成Xilinx AI Engine的CPU芯片...... 2) 系统集成革命
    发表于 03-03 11:21

    AI赋能边缘网关:开启智能时代的新蓝海

    。这一变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和带宽压力。AI技术
    发表于 02-15 11:41

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构的图形处理器(GPU)IP系列。这一新一代GPU架构以其卓越的计算性能和广泛的应用领域,吸引了业界的广泛
    的头像 发表于 12-24 10:55 1292次阅读

    芯原推出新一代高性能Vitality架构GPU IP系列

    原新一代Vitality GPU架构显著提升了计算性能,并支持多核扩展,以进一步提升性能。该GPU架构集成了诸多先进功能,如一个可配置的张量
    的头像 发表于 12-19 15:55 731次阅读