0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

软硬协同优化,地平线旭日3成功部署14亿参数大语言模型

章鹰观察 来源:厂商供稿 作者:地平线 2023-09-12 13:36 次阅读

近日,地平线成功在旭日3中的BPU®️计算单元上,部署运行参数规模高达14亿的大语言模型(Large Language Model , LLM)。这不仅是业界在端侧成功部署大模型的一次突破性实践,更验证了BPU®️对先进神经网络算法的高效支持,为大模型在端侧实现产品级应用拓展了更广阔的想象空间。

大模型端侧部署的技术实践对加速智能化产业变革具有重要意义。端侧部署具备实时性、低时延优势,能够灵活支持弱网或无网等丰富场景,为终端用户提供更流畅、稳定的交互体验;同时端侧支持信息本地化处理,可有效保护用户数据与隐私安全;端侧计算还将大幅缓解云端算力压力,端云协同更会驱动产业降本提效,加速实现大模型技术的应用普惠。

然而,大模型端侧推理部署仍面临巨大挑战。区别于云端推理部署计算资源应用尽用,端侧部署大模型并实现产品级应用,则需综合考量不同应用间的计算资源分配,以及计算效率、带宽占用与功耗等各项指标。如何在众多约束条件下最大程度地提高大模型端侧推理效率是面临的首要技术挑战。此外,推理过程将大量占用内存带宽,如何在不影响推理结果的前提下减少内存访问,降低带宽依赖,进而减少推理耗时,则需要在软件工程层面进行系统优化。

作为软硬协同技术路径的坚定践行者,地平线通过硬件资源的最大化利用和软件工程的极致优化,并成功在5 TOPS算力的边缘计算芯片上部署高达14亿级参数的大语言模型。这源于旭日3所搭载的双核BPU®️伯努利计算单元对神经网络计算的原生性支持,能够在处理大语言模型方面提供高性能、低功耗的计算处理能力。另一方面,地平线通过软硬协同编译,采用算子重写、算子重排、算子融合和KV-Cache等技术,进一步优化了模型结构,实现推理速度的成倍提升。

从资源占用情况看,该大语言模型在旭日3上的应用效果表现优异,CPU占用单核60%、BPU占用单核50%,为后续其他应用预留充足的算力资源;同时在5GB/s内存带宽基础上实现了约4~5字/秒的生成速度,可充分满足实时性需求;在最能体现真实效能的FPS/Watt指标上,该模型的运行效能相较于LLaMA.cpp等纯CPU方案提升了2.5倍。这也意味着,旭日3对此大预言模型的支持性可达到产品级应用水平。

地平线现已通过GitHub开放该模型的推理代码,开发者可通过RDK X3系列开发者套件,即刻前往「NodeHub全开源机器人应用中心」推荐项目,尝鲜体验大语言模型在旭日3上的实际运行效果,更期待各位开发者参与「星光之路」活动,一同探索大模型在旭日3的上层应用落地!

我们相信,通过软硬协同的技术路径,大模型端侧应用部署将驱动人机交互方式变革,多维度提升用户智能化体验,加速“智能计算平权”时代的到来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 地平线
    +关注

    关注

    0

    文章

    306

    浏览量

    14640
收藏 人收藏

    评论

    相关推荐

    官宣10家首批量产合作车企,地平线征程6发布即爆款

    4月24日,地平线举办“征程所向,向高而行”——2024智驾科技产品发布会。立足于智能驾驶时代,地平线凭借对软硬结合全栈技术理念的前瞻预判和深厚积累,重磅发布新一代车载智能计算方案征程®6系列以及
    的头像 发表于 04-25 07:07 1649次阅读
    官宣10家首批量产合作车企,<b class='flag-5'>地平线</b>征程6发布即爆款

    智能驾驶头部企业地平线赴港IPO

    地平线向港交所递交了上市申请,正式启动港股IPO进程,这一行动引起了市场的广泛关注。在此次上市过程中,高盛、摩根士丹利以及中信建投共同担任联席保荐人,为地平线的上市之路提供了强大的支持。
    的头像 发表于 03-28 16:45 436次阅读

    智能驾驶领军企业地平线递表港交所

    港交所最新文件披露,智能驾驶领域的领军企业地平线已正式提交港股上市申请。据悉,地平线在2023年实现了令人瞩目的业绩,营收达到15.5亿元,同比增长高达71.3%。同时,其毛利也达到了10.94亿元,毛利率稳定在70.5%的高水平。
    的头像 发表于 03-27 16:21 435次阅读

    地平线提交香港IPO申请

    智能驾驶计算方案提供商“地平线”正式递交港股上市申请。据其公开文件,地平线在2023年实现了15.5亿元的营收,同比显著增长71.3%,毛利达到10.94亿元,毛利率高达70.5%。
    的头像 发表于 03-27 16:11 337次阅读

    地平线向港交所递交招股书

    智能驾驶计算方案领军者地平线,近日正式向港交所递交了招股书,高盛、摩根士丹利及中信建投为其联席保荐人。这并非地平线首次试水资本市场,早在2021年,地平线就计划科创板上市,并一度传出赴美IPO的消息,但受资本市场环境影响,其上市
    的头像 发表于 03-27 16:02 208次阅读

    地平线创始人余凯:已超110款量产车型采用地平线芯片

    自2020年以来,地平线成功与长安汽车合作推出UNI—K、UNI—T、UNI—V等产品;直至今年,已有近30位国内车企成为其重要客户,如比亚迪和理想汽车均为其智能驾驶芯片的主要采购商。
    的头像 发表于 03-18 09:49 162次阅读

    地平线再获奇瑞协同创新特别贡献奖

    在奇瑞汽车2024供应链生态圈年会上,地平线荣获奇瑞汽车颁发的“协同创新特别贡献奖”,这也是地平线连续第二年荣获该奖项,地平线总裁陈黎明博士受邀出席并代表公司获颁奖项。与此同时,陈黎明
    的头像 发表于 01-22 11:16 794次阅读

    走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

    近日,美格智能发挥软硬件一体协同开发能力,融合阿加犀卓越的AI优化部署技术,在搭载高通QCS8550平台的高算力AI模组上,成功运行了一系列
    的头像 发表于 11-14 14:39 526次阅读

    走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

    近日,美格智能发挥软硬件一体协同开发能力,融合阿加犀卓越的AI优化部署技术,在搭载高通QCS8550平台的高算力AI模组上,成功运行了一系列
    的头像 发表于 11-14 14:34 215次阅读
    走向边缘智能,美格智能携手阿加犀<b class='flag-5'>成功</b>在高算力AI模组上运行一系列大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    地平线旭日3成功部署运行参数规模高达14亿的大语言模型

    近日,地平线成功旭日3中的BPU计算单元上,部署运行参数规模高达14亿的大
    的头像 发表于 09-12 09:24 515次阅读

    2023 IAA MOBILITY开展地平线亮相

    2023 IAA MOBILITY开展地平线亮相
    的头像 发表于 09-06 14:12 402次阅读
    2023 IAA MOBILITY开展<b class='flag-5'>地平线</b>亮相

    科沃斯最新款扫地机器人搭载地平线旭日3芯片上市

    近日,服务机器人领导品牌——科沃斯最新款扫地机器人“地宝DEEBOT X2”,全系产品搭载地平线旭日3芯片上市。 DEEBOT X2重新定义扫地机器人产品形态,率先采用方形机身设计,专为边角清扫而生
    的头像 发表于 08-25 09:50 1614次阅读

    地平线RDK系列再升级,NodeHub惊喜发布

    7月25日,“地平线2023机器人开发者创享日”在深圳成功举办。活动现场,地平线官宣了一系列重要发布:全新地平线RDK系列机器人开发者套件正式上线,机器人操作系统TogetheROS.
    发表于 07-26 09:01 371次阅读
    <b class='flag-5'>地平线</b>RDK系列再升级,NodeHub惊喜发布

    地平线RDK X3语音算法通过Alexa ACM方案认证

    地平线RDK X3是地平线基于自研的旭日3芯片,针对通用机器人开发场景打造的智能开发板,为各类算法的开发部署提供了坚实的硬件基础。地平线RD
    的头像 发表于 07-18 16:37 847次阅读
    <b class='flag-5'>地平线</b>RDK X3语音算法通过Alexa ACM方案认证

    地平线将基于征程系列芯片赋能安波福打造完全集成的软硬件解决方案

    此次合作中,地平线将基于征程系列芯片,赋能安波福及旗下关键任务智能边缘软件的全球领导者风河公司为整车厂商打造完全集成的软硬件解决方案,其中包括运行在征程系列芯片上的风河边缘到云产品组合。通过
    的头像 发表于 07-03 11:04 691次阅读