0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不只是智能驾驶!从SRAM到RRAM,存算一体大算力芯片将赋能更多领域!

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-09-25 07:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)近几年,随着物联网人工智能等技术的发展,算力的需求越来越大。而在冯诺依曼架构下,芯片性能的提升遇到瓶颈。业界开始不断探索新的技术形式,因为具备大算力、低功耗的特点,存算一体架构芯片应运而生。

后摩智能是一家致力于存算一体大算力芯片研发的企业,成立于2020年。今年5月,该公司发布了首款SRAM存算一体智驾芯片后摩鸿途™H30,这也是全球首款面向智能驾驶领域的存算一体芯片。此外,今年8月该公司宣布完成首款RRAM存算芯片的测试,可以说在存算一体大算力方面进展迅速。

近日,电子发烧友采访到后摩智能公共事务部负责人屈艳格,就其在存储介质及应用赛道的选择,存算一体发展趋势及后摩智能未来规划方面做了探讨。

从SRAM到RRAM,后摩智能是如何选择存储介质的

后摩智能今年5月推出的首款存算一体智驾芯片H30,最高物理算力256TOPS,典型功耗35W。该芯片基于SRAM存储介质,采用数字存算一体架构,拥有极低访存功耗和超高计算密度,仅用12nm工艺制程,在Int8数据精度下,其AI核心IPU能效比达15Tops/W,是传统架构芯片7倍以上。

据了解,H30已成功运行CV类的经典网络,以及自动驾驶领域先进的BEV、Pointpillar等模型。为了更好地实现车规级,后摩智能基于H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。

屈艳格告诉电子发烧友,虽然相对来说,后摩智能在AI芯片方面算是入局较晚的企业了,但相对传统架构的AI芯片,后摩智能推出这款存算一体架构的H30有它突出的优势。

她总结了三点:1、高计算效率。在相同工艺制程下,它比传统冯诺依曼架构的AI芯片能效比更优,比如,英伟达Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一体芯片物理算力士256TPOS,功耗是35W,它的能效比能够达到7.3TPOS/W。

在当前业界,这样的能效比是相当高的。对于客户来说,这是一款非常有竞争力的产品,因为几乎所有的计算场景,它对功耗的需求都较为敏感,而这款产品在低功耗的情况下,仍然能够实现很高的算力。

2、低计算时延。因为是存算一体架构,这款芯片最大的特点是,在数据传传输过程中不用来回搬运数据,这样的好处是:一、极大地减少功耗,二、延时也会大大减少。后摩智能此前对此做过测算,它跟传统架构的芯片相比,大概会有两倍的延时提升。而这在一些对安全有极高要求的场景,比如智能驾驶,优势会非常明显。

3、低工艺依赖性。因为是存算一体架构,它对先进工艺制程的依赖性并没有那么强,它可以用传统的工艺实现先进工艺才能实现的特点。比如,要实现100TOPS算力,大部分公司会采用比较先进的工艺制程,12nm或者7nm,而后摩智能因为是存算一体架构芯片,可以采用28nm,就能够达到这样的算力。

存算一体架构对工艺的依赖性不强,有其非常大的战略意义。在当前的国际局势下,对于国内的企业来说,如何保障供应链安全很重要。如果真的出现先进制程供应紧张的情况下,存算一体架构芯片仍然能够用一些较成熟的工艺制程生产芯片,同时还能实现较高的算力。

除了发布首款基于SRAM存储介质的H30之外,后摩智能也在探索RRAM存储介质的存算一体芯片。RRAM虽然诞生已久,但在近几年才较多的被关注。相对于来说,RRAM在技术成熟度上不及SRAM,为何后摩智能在成功推出SRAM介质的存算一体芯片之后,又会着手研究RRAM存储介质的存算一体芯片呢?

在采访中,屈艳格详细介绍了不同存储介质的特点,以及后摩智能在存储介质选择上的考量。据她介绍,存算一体芯片有两个很典型的特点:一是大算力,二是低功耗。这两个特点也使得它能实现比较高的能效比。不过从使用来看,重点还是要看哪个是第一个要关注的指标,是大算力,还是低功耗。而后摩智能关注的第一个指标是大算力。

因此在进行存储介质选择的时候,后摩智能会选择更适合做大算力场景的存储介质,比如SRAM、MRAM、RRAM等。因为这些存储介质,可以用来做数字电路,能够用于智能驾驶、智能工业、机器人以及云端大模型推理等场景。而Flash这种存储介质,更适合用在小算力,对功耗要求较高的场景,比如蓝牙耳机、可穿戴手表等。屈艳格介绍说:“因为我们更关注大算力,所以会选择在SRAM、MRAM、RRAM这些存储介质上做技术演进。”

据她介绍,后摩智能当前选择SRAM这个存储介质的主要原因:一是目前SRAM在做大算力方面最为成熟,它可以支持较为先进的工艺制程,读写速度也比较快。二是虽然它是很成熟的存储介质,而在当前的产业界,将它用作存内计算,且算力达到几十TOPS,同时又是做纯数字电路,并且用在工业、智能驾驶场景中的几乎没有。

后摩智能在2021年通过技术验证的流片成功,证明这条技术路径可行,于是便进一步推进,在今年5月推出第一代产品H30。这款基于SRAM的存算一体芯片H30,主要可用在智能驾驶和机器人等领域。屈艳格进一步谈到:“我们下一代还会基于SRAM做存算一体架构优化,包括整个电路、架构的优化,以进一步提升产品性能。按照初步规划,未来会基于SRAM介质研发几款产品,逐步将性能做到最佳。”

当然她也提到,SRAM有它的缺点,比如存储密度相对较低,这样它的芯片面积会有点大,其计算密度相对来说不会太高。因此,后摩智能考虑再选择一些更适合的存储介质,比如MRAM、RRAM这些比较新型的存储器。相对来说,这两款存储介质的读写性能更好,存储密度更大。

屈艳格说:“我们会在这两款介质上做一些技术预研,类似2021年基于SRAM做过的技术验证,等确定行得通之后,再进行下一步的推进,今年8月宣布的初步验证的结果。” 她表示:“我们会根据这些存储介质的成熟性,以及它做存算电路的优势。再根据场景情况,把这个技术从SRAM切换到RRAM或者MRAM上去。”

做透智能驾驶市场,未来希望赋能机器人、云端推理等更多场景

从2020年成立到现在仅三年时间,后摩智能便已经推出第一代SRAM存算一体芯片,同时完成首款RRAM大容量存储芯片的测试。这在做存算一体大算力芯片领域算是相当快了。屈艳格认为,公司在技术和产品推进上能够如此之快,与其完善的团队搭建有关。

后摩智能的团队包括两方面的人才:一部分是在存算一体技术领域有深度研究的人,一部分是在工程落地方面有丰富经验积累的人。在存算方面,后摩智能的团队发布分来自海外知名院校、研究机构和企业,在存算一体、先进存储器方面大概有15年左右的积累。其中一个核心成员,曾经做过六次基于SRAM存算芯片的流片,具有丰富的经验。

这是偏学术方面的经验,另外,后摩智能很好的将这些学术经验与产业界的团队做了结合。后摩智能还组建了一支产业的工程化落地团队,这个团队大部分员工来自AMDIntel,还有华为海思等,具有百万级智驾芯片量产落地经验,学术和产业团队的结合,加速了公司将产品推向商业化落地的进程。

在应用赛道的选择上,后摩智能也做了仔细的考量。据屈艳格介绍,公司成立初期,做了大量的调研,去思考选择什么样的赛道,对数据中心、安防、智能驾驶等都进行了分析。

比如数据中心,这个市场需要大算力,需求量也非常大,尤其是今年大模型迅速发展,未来市场空间会更大。可是分析下来可以发现,数据中心市场90%以上由英伟达的GPU占据,算法迭代快,对英伟达CUDA生态的依赖强。第三方初创企业想进去构建自己的生态,很难。

再比如安防市场,相对来说它对算力的要求比较低,生态依赖度不高,是一个成熟市场。可是,它对算力要求并不高。而后摩智能的核心特点是,容易做大算力的产品,安防市场并不能凸显出公司的优势。

后来确定选择智能驾驶赛道,有两个方面的原因:1、当前智能驾驶是一个发展比较快的行业,每年增速差不多30%以上。尤其现在,我国智能化全球领先,未来市场极其可观。智能驾驶对算力要求很大,L1/L2可能需要几TOPS,到L2++以及未来L4/L5级自动驾驶,它需要的算力会达到上千TOPS,存算一体跟这个市场的需求匹配度很高。

2、虽然智能驾驶现在发展很快,但这个市场刚开始没多长时间。虽然已经有几家巨头企业,包括英伟达、高通、TI,以及国内几家头部企业开始在做,并且取得了不错的成绩。但是相对来说推进的时间还不是很长,整个生态并没有那么成熟,还有去冲刺的机会。

后摩智能推出的首款智能驾驶芯片,是一款通用的产品,它可以像英伟达Orin芯片一样,去适配更多车厂的主流算法。目前已经与新石器、环宇智行等无人车企业达成合作,另外在乘用车方面,也正在与车企业推进测试中。

谈到未来规划,屈艳格表示,公司首先还是会基于SRAM存储介质去进行不断产品优化,面向智能驾驶领域,将这块市场打透,建立起足够高的壁垒。此外还会不断深耕机器人、智能工业、电力、云端推理等领域,去赋能更多的场景。

结尾

可以看到,经过近几年的发展,存算一体已经逐渐在一些场景中得到应用。今年以来,大模型及AIGC迅速发展,它对算力的需求越来越大,而当前传统架构的芯片在性能提升上遇到瓶颈,存算一体在这方面却优势明显,未来将会有很大的应用空间。

虽然存算一体作为一门新技术,在产品和应用的推进上存在挑战。而如今,SRAM已经实现大算力的存算,新型存储介质也在加速推进产业落地。可想而知,未来随着MRAM、RRAM这些新型存储介质的成熟商业化,存算一体的可想像空间将会更大。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SRAM技术
    +关注

    关注

    0

    文章

    4

    浏览量

    2012
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    智能驾驶域控制器:车规电容如何车载场景?

    智能驾驶域控制器的高车载场景中,车规电容通过 稳定供电、抑制噪声、缓冲能量、集成化设计 四大核心功能,为高
    的头像 发表于 11-21 09:30 124次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>驾驶</b>域控制器:车规电容如何<b class='flag-5'>赋</b><b class='flag-5'>能</b>高<b class='flag-5'>算</b><b class='flag-5'>力</b>车载场景?

    后摩尔定律时代,3D-CIM+RISC-V打造国产一体新范式

    效与带宽瓶颈成为行业前行的关键阻碍,而美西方的技术禁运更让中国芯片产业面临严峻挑战。   在这大背景下,
    发表于 09-17 09:31 5328次阅读
    后摩尔定律时代,3D-CIM+RISC-V打造国产<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>新范式

    在TR组件优化与一体架构中构建技术话语权

    电磁兼容性、热管理在内的12项专业能力评估。\"这种评估体系,正是行业对技术人才的分级认证标准。 1.2 异构计算架构下的能力矩阵 一体架构的普及正在重构工程师的知识体系: 近内存计算
    发表于 08-26 10:40

    文看懂“一体

    今天这篇文章,我们来聊个最近几年很火的概念——一体。为什么会提出“
    的头像 发表于 08-18 12:15 945次阅读
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>”

    一体技术加持!后摩智能 160TOPS 端边大模型AI芯片正式发布

    ,同步推出力擎™系列M.2卡、谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。这系列动作标志着后摩智能
    的头像 发表于 07-30 07:57 7631次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>技术加持!后摩<b class='flag-5'>智能</b> 160TOPS 端边大模型AI<b class='flag-5'>芯片</b>正式发布

    缓解高性能一体芯片IR-drop问题的软硬件协同设计

    在高性能计算与AI芯片领域,基于SRAM一体(Processing-In-Memory,
    的头像 发表于 07-11 15:11 906次阅读
    缓解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>IR-drop问题的软硬件协同设计

    国际首创新突破!中国团队以一体排序架构攻克智能硬件加速难题

    2025 年 6 月 25 日,北京大学团队在智能计算硬件方面取得领先突破,国际上首次实现了基于一体技术的高效排序硬件架构 (A fast and reconfigurable
    的头像 发表于 07-02 16:50 553次阅读
    国际首创新突破!中国团队以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>排序架构攻克<b class='flag-5'>智能</b>硬件加速难题

    智能基建:RAKsmart如何代AI开发工具

    当今,AI模型的复杂化与规模化对提出了前所未有的要求。然而,传统的基础设施在灵活性、成本效率和可扩展性上逐渐显露出瓶颈。而RAKsmart凭借其全球化的
    的头像 发表于 05-07 09:40 362次阅读

    苹芯科技 N300 一体 NPU,开启端侧 AI 新征程

    随着端侧人工智能技术的爆发式增长,智能设备对本地效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制
    的头像 发表于 05-06 17:01 865次阅读
    苹芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b> NPU,开启端侧 AI 新征程

    芯片的生态突围与革命

    据的爆发式增长,大芯片已成为科技竞争的核心领域。   大
    的头像 发表于 04-13 00:02 2616次阅读

    PIMCHIP S300 全球首款28nm节点实现存一体产品化AI芯片

    PIMCHIP-S300 芯片是苹芯科技基于一体技术打造的多模态智慧感知决策 AI 芯片。其搭载基于静态随机存取存储器(
    的头像 发表于 03-28 17:06 2005次阅读
    PIMCHIP S300 全球首款28nm节点实现存<b class='flag-5'>算</b><b class='flag-5'>一体</b>产品化AI<b class='flag-5'>芯片</b>

    济南市中区一体化智中心上线DeepSeek

    济南市中未来产业发展有限公司(简称“市中产发”)联合华为、北京昇腾和清昴智能基于市中区一体化智中心(国家大学科技园节点)昇腾
    的头像 发表于 02-19 10:38 1172次阅读

    一体行业2024年回顾与2025年展望

    2024年,大模型技术的迅猛发展成为人工智能领域的核心驱动力,其对硬件和存储效率的极致需求,促使
    的头像 发表于 01-23 11:24 1688次阅读