0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存算一体架构:解决智能驾驶芯片算力和功耗难题

Carol Li 来源:电子发烧友网 作者:李弯弯 2022-09-08 07:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)智能驾驶是未来的必然趋势,近几年汽车智能化技术越来越成熟,同时政府也在不断出台新政策,支持和鼓励智能驾驶的稳步发展。

未来几年汽车智能化商业进程将持续加速,数据显示,2025年全球自动驾驶汽车出货量预计达5000万台,中国L2级以上智能汽车销量将破1000万台,智能汽车渗透率将达50%。

在不久前某论坛上,后摩智能创始人&CEO吴强博士谈到,智能驾驶规模化商用需要满足3个要素,一是强智能,二是低成本,三是安全性,而这也对智能驾驶计算芯片提出了新的要求,需要未来的智能驾驶芯片满足大算力、低功耗、低成本、高可靠的要求。


而从当前的情况来看,矛盾点在于:需求侧,算力需求在不断增长,原因是智能汽车配备的传感器数量持续增加和升级,需要处理的数据量越来越大,比如2019年Model3,配备传感器21个,包括8个120万像素摄像头,12个超声波雷达,1个毫米波雷达,算力为144T;到2022年,蔚来ET7,配备了33个传感器,包括7个800万像素摄像头,4个300万摄像头,12个超声波雷达,5个毫米波雷达,1个激光雷达,算力达到1000T。

另外算法越来越复杂,芯片需要更高的开放度,未来OTA升级需进行算力预埋,比如新势力车厂预埋的算力就超过500T,包括蔚来、理想、小鹏等。

而供给侧,传统方案面临挑战,比如依赖先进制程和工艺,3nm/5nm先进制程成本昂贵,HBM/3D封装依赖先进IP,需要牺牲通用性换取计算效率,算法和芯片高度耦合

也就是说,传统方案成本昂贵,且依赖少数国际大厂的IP,功耗过高,增加散热系统成本,高度耦合的封闭方案无法支持未来的算法演进和OTA升级,那么可以如何解决呢?吴强博士认为,创新计算架构存算一体,是解决智能驾驶算力和功耗难题很好的方式。

存算一体是与传统冯诺伊曼架构安全不同的架构形式,即直接在存储内做计算,过去几年国内外不少芯片巨头和初创企业投入到存算一体技术的研究中,目前已经在终端一些应用领域实现商用,随着技术的不断进步,有企业逐渐将产品推向边缘、汽车等应用领域。

相比较来看,存算一体的优势体现在几个方面,一、可以做到更高的有效算力,突破1000TOPS,成本低,不依赖于先进工艺、3D封装等昂贵的技术;二、低功耗,相同算力下,AI部分能效比2-3个数量级提升,更低散热成本,更高可靠性;三、低延时,较GPU延时有2-10倍提升,更高的安全性;四、弱工艺依赖,不依赖先进工艺,可以用成熟制程,更好应对供应链被压制的挑战。

比如在散热方面,汽车最好的方式是采用自然风冷,功耗小于15W,成本低可靠性高,维修成本低,而冯诺伊曼架构,自然风冷功耗限制下,物理算力约只能做到20TOPS,存算一体架构,自然风冷功耗限制下,物理算力可以超过60TOPS。从这个层面来看,对于未来的智能驾驶汽车来说,存算一体架构会更加合适。

从电子发烧友的了解来看,目前后摩智能在将存算一体推向智能驾驶领域方面是最为领先的,这家公司于2020年9月完成天使轮融资,2020年11月正式成立,启动存算一体大算力AI芯片的研发,2022年4月已经完成PreA+轮融资。

该公司在2021年8月完成首颗芯片技术验证流片,据吴强介绍,后摩智能首颗芯片,算力20T@INT8(可扩展到200T+),已成功跑通自动驾驶典型算法,完成11个类别的检测、识别、语义分割,是存算一体芯片首次达到运行智能驾驶的复杂AI场景所需算力和精度要求。

根据规划,2022年到2025年间,后摩智能将主要基于SRAM,推出系列产品,包括HM300,HM500,HM1000,算力从30Tops@INT8提升到500Tops@INT8,能效比实现10倍提升;到2025年之后,将推出基于MRAM/RRAM的产品系列,包括HM310,HM510,HM1010,实现算力从50Tops@INT8到2000Tops@INT8突破,能效比的提升100倍。

另外,后摩智能的存算一体芯片,采用类CUDA的编程模式,这样可以降低客户应用的开发成本,支持TensorFlow、PyTorch、ONNX等算法框架。

就如上文所言,未来几年中国汽车智能化将会持续加速发展,这必将带动上游芯片、零部件的持续创新,虽然从目前来看,存算一体芯片还未真正在智能驾驶汽车上实现商用落地,不过存算一体创新架构在算力、功耗等方面的优势确实明显。相信未来在技术的不断更迭,以及智能驾驶汽车市场的驱动下,将会逐渐取得成绩,当然作为一项新兴技术,面临的困难也是不言而喻的。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能驾驶
    +关注

    关注

    5

    文章

    3073

    浏览量

    51423
  • 存算一体
    +关注

    关注

    1

    文章

    122

    浏览量

    5260
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    拆解一体技术瓶颈,亿铸科技如何逐个突破

    搬运,不仅造成带宽与时延瓶颈,还产生极高额外能耗。行业内个公认的观点是:当前 AI 计算中数据搬运成本已远超计算本身成本,存储墙、能耗墙成为制约的两大核心瓶颈。
    的头像 发表于 05-14 09:51 238次阅读

    宁畅正式发布智智能一体

    近日,宁畅正式发布「智舱」智能一体机——款集高
    的头像 发表于 05-14 09:43 398次阅读

    安克创新发布Thus™芯片一体架构重塑AI音频新生态

    2026年4月22日,安克创新在深圳举办技术沟通会,正式推出全球首款基于NOR Flash技术的神经网络一体(CIM)AI音频芯片Thus™。这款
    的头像 发表于 04-23 09:59 4388次阅读

    革命下的隐形基石:一体时代呼唤更精准的“时间心跳”

    在人工智能浪潮的席卷下,已成为衡量科技实力的核心标尺。从苹果M4芯片每秒38万亿次的神经引擎运算,到概盒机型NX9031宣称的千亿次级
    的头像 发表于 01-21 08:44 1009次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>革命下的隐形基石:<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>时代呼唤更精准的“时间心跳”

    科技王绍迪:AI可穿戴需求爆发,一体成主流AI芯片架构

    集中在AI驱动的细分场景需求释放,知科技聚焦的一体芯片具备高技术壁垒,同时在AI发展需求下具备天然的
    的头像 发表于 12-23 09:34 1.1w次阅读
    知<b class='flag-5'>存</b>科技王绍迪:AI可穿戴需求爆发,<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>成主流AI<b class='flag-5'>芯片</b><b class='flag-5'>架构</b>

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下
    发表于 10-27 13:12

    一体AI芯片公司九天睿芯完成超亿元B轮融资

    全球领先的一体AI芯片公司九天睿芯(英文:Reexen Technology)近日宣布,公司已完成B轮融资,规模超亿元人民币。
    的头像 发表于 10-10 11:41 1629次阅读

    后摩尔定律时代,3D-CIM+RISC-V打造国产一体新范式

    、能效与带宽瓶颈成为行业前行的关键阻碍,而美西方的技术禁运更让中国芯片产业面临严峻挑战。   在这大背景下,
    发表于 09-17 09:31 6364次阅读
    后摩尔定律时代,3D-CIM+RISC-V打造国产<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>新范式

    在TR组件优化与一体架构中构建技术话语权

    电磁兼容性、热管理在内的12项专业能力评估。\"这种评估体系,正是行业对技术人才的分级认证标准。 1.2 异构计算架构下的能力矩阵 一体架构
    发表于 08-26 10:40

    文看懂“一体

    今天这篇文章,我们来聊个最近几年很火的概念——一体。为什么会提出“
    的头像 发表于 08-18 12:15 1760次阅读
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>”

    一体技术加持!后摩智能 160TOPS 端边大模型AI芯片正式发布

    ,同步推出力擎™系列M.2卡、谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。这系列动作标志着后摩智能
    的头像 发表于 07-30 07:57 9164次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>技术加持!后摩<b class='flag-5'>智能</b> 160TOPS 端边大模型AI<b class='flag-5'>芯片</b>正式发布

    2025端侧AI芯片爆发:一体、非Transformer架构谁主浮沉?边缘计算如何选型?

    各位技术大牛好!最近WAIC 2025上端侧AI芯片密集发布,彻底打破传统困局。各位大佬在实际项目中都是如何选型的呢?
    发表于 07-28 14:40

    缓解高性能一体芯片IR-drop问题的软硬件协同设计

    在高性能计算与AI芯片领域,基于SRAM的一体(Processing-In-Memory, PIM)架构因兼具计算密度、能效和精度优势成
    的头像 发表于 07-11 15:11 1739次阅读
    缓解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>IR-drop问题的软硬件协同设计

    国际首创新突破!中国团队以一体排序架构攻克智能硬件加速难题

    2025 年 6 月 25 日,北京大学团队在智能计算硬件方面取得领先突破,国际上首次实现了基于一体技术的高效排序硬件架构 (A fas
    的头像 发表于 07-02 16:50 1050次阅读
    国际首创新突破!中国团队以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>排序<b class='flag-5'>架构</b>攻克<b class='flag-5'>智能</b>硬件加速<b class='flag-5'>难题</b>