0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不只是智能驾驶!从SRAM到RRAM,存算一体大算力芯片将赋能更多领域!

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-09-25 07:00 次阅读
电子发烧友网报道(文/李弯弯)近几年,随着物联网人工智能等技术的发展,算力的需求越来越大。而在冯诺依曼架构下,芯片性能的提升遇到瓶颈。业界开始不断探索新的技术形式,因为具备大算力、低功耗的特点,存算一体架构芯片应运而生。

后摩智能是一家致力于存算一体大算力芯片研发的企业,成立于2020年。今年5月,该公司发布了首款SRAM存算一体智驾芯片后摩鸿途™H30,这也是全球首款面向智能驾驶领域的存算一体芯片。此外,今年8月该公司宣布完成首款RRAM存算芯片的测试,可以说在存算一体大算力方面进展迅速。

近日,电子发烧友采访到后摩智能公共事务部负责人屈艳格,就其在存储介质及应用赛道的选择,存算一体发展趋势及后摩智能未来规划方面做了探讨。

从SRAM到RRAM,后摩智能是如何选择存储介质的

后摩智能今年5月推出的首款存算一体智驾芯片H30,最高物理算力256TOPS,典型功耗35W。该芯片基于SRAM存储介质,采用数字存算一体架构,拥有极低访存功耗和超高计算密度,仅用12nm工艺制程,在Int8数据精度下,其AI核心IPU能效比达15Tops/W,是传统架构芯片7倍以上。

据了解,H30已成功运行CV类的经典网络,以及自动驾驶领域先进的BEV、Pointpillar等模型。为了更好地实现车规级,后摩智能基于H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。

屈艳格告诉电子发烧友,虽然相对来说,后摩智能在AI芯片方面算是入局较晚的企业了,但相对传统架构的AI芯片,后摩智能推出这款存算一体架构的H30有它突出的优势。

她总结了三点:1、高计算效率。在相同工艺制程下,它比传统冯诺依曼架构的AI芯片能效比更优,比如,英伟达Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一体芯片物理算力士256TPOS,功耗是35W,它的能效比能够达到7.3TPOS/W。

在当前业界,这样的能效比是相当高的。对于客户来说,这是一款非常有竞争力的产品,因为几乎所有的计算场景,它对功耗的需求都较为敏感,而这款产品在低功耗的情况下,仍然能够实现很高的算力。

2、低计算时延。因为是存算一体架构,这款芯片最大的特点是,在数据传传输过程中不用来回搬运数据,这样的好处是:一、极大地减少功耗,二、延时也会大大减少。后摩智能此前对此做过测算,它跟传统架构的芯片相比,大概会有两倍的延时提升。而这在一些对安全有极高要求的场景,比如智能驾驶,优势会非常明显。

3、低工艺依赖性。因为是存算一体架构,它对先进工艺制程的依赖性并没有那么强,它可以用传统的工艺实现先进工艺才能实现的特点。比如,要实现100TOPS算力,大部分公司会采用比较先进的工艺制程,12nm或者7nm,而后摩智能因为是存算一体架构芯片,可以采用28nm,就能够达到这样的算力。

存算一体架构对工艺的依赖性不强,有其非常大的战略意义。在当前的国际局势下,对于国内的企业来说,如何保障供应链安全很重要。如果真的出现先进制程供应紧张的情况下,存算一体架构芯片仍然能够用一些较成熟的工艺制程生产芯片,同时还能实现较高的算力。

除了发布首款基于SRAM存储介质的H30之外,后摩智能也在探索RRAM存储介质的存算一体芯片。RRAM虽然诞生已久,但在近几年才较多的被关注。相对于来说,RRAM在技术成熟度上不及SRAM,为何后摩智能在成功推出SRAM介质的存算一体芯片之后,又会着手研究RRAM存储介质的存算一体芯片呢?

在采访中,屈艳格详细介绍了不同存储介质的特点,以及后摩智能在存储介质选择上的考量。据她介绍,存算一体芯片有两个很典型的特点:一是大算力,二是低功耗。这两个特点也使得它能实现比较高的能效比。不过从使用来看,重点还是要看哪个是第一个要关注的指标,是大算力,还是低功耗。而后摩智能关注的第一个指标是大算力。

因此在进行存储介质选择的时候,后摩智能会选择更适合做大算力场景的存储介质,比如SRAM、MRAM、RRAM等。因为这些存储介质,可以用来做数字电路,能够用于智能驾驶、智能工业、机器人以及云端大模型推理等场景。而Flash这种存储介质,更适合用在小算力,对功耗要求较高的场景,比如蓝牙耳机、可穿戴手表等。屈艳格介绍说:“因为我们更关注大算力,所以会选择在SRAM、MRAM、RRAM这些存储介质上做技术演进。”

据她介绍,后摩智能当前选择SRAM这个存储介质的主要原因:一是目前SRAM在做大算力方面最为成熟,它可以支持较为先进的工艺制程,读写速度也比较快。二是虽然它是很成熟的存储介质,而在当前的产业界,将它用作存内计算,且算力达到几十TOPS,同时又是做纯数字电路,并且用在工业、智能驾驶场景中的几乎没有。

后摩智能在2021年通过技术验证的流片成功,证明这条技术路径可行,于是便进一步推进,在今年5月推出第一代产品H30。这款基于SRAM的存算一体芯片H30,主要可用在智能驾驶和机器人等领域。屈艳格进一步谈到:“我们下一代还会基于SRAM做存算一体架构优化,包括整个电路、架构的优化,以进一步提升产品性能。按照初步规划,未来会基于SRAM介质研发几款产品,逐步将性能做到最佳。”

当然她也提到,SRAM有它的缺点,比如存储密度相对较低,这样它的芯片面积会有点大,其计算密度相对来说不会太高。因此,后摩智能考虑再选择一些更适合的存储介质,比如MRAM、RRAM这些比较新型的存储器。相对来说,这两款存储介质的读写性能更好,存储密度更大。

屈艳格说:“我们会在这两款介质上做一些技术预研,类似2021年基于SRAM做过的技术验证,等确定行得通之后,再进行下一步的推进,今年8月宣布的初步验证的结果。” 她表示:“我们会根据这些存储介质的成熟性,以及它做存算电路的优势。再根据场景情况,把这个技术从SRAM切换到RRAM或者MRAM上去。”

做透智能驾驶市场,未来希望赋能机器人、云端推理等更多场景

从2020年成立到现在仅三年时间,后摩智能便已经推出第一代SRAM存算一体芯片,同时完成首款RRAM大容量存储芯片的测试。这在做存算一体大算力芯片领域算是相当快了。屈艳格认为,公司在技术和产品推进上能够如此之快,与其完善的团队搭建有关。

后摩智能的团队包括两方面的人才:一部分是在存算一体技术领域有深度研究的人,一部分是在工程落地方面有丰富经验积累的人。在存算方面,后摩智能的团队发布分来自海外知名院校、研究机构和企业,在存算一体、先进存储器方面大概有15年左右的积累。其中一个核心成员,曾经做过六次基于SRAM存算芯片的流片,具有丰富的经验。

这是偏学术方面的经验,另外,后摩智能很好的将这些学术经验与产业界的团队做了结合。后摩智能还组建了一支产业的工程化落地团队,这个团队大部分员工来自AMDIntel,还有华为海思等,具有百万级智驾芯片量产落地经验,学术和产业团队的结合,加速了公司将产品推向商业化落地的进程。

在应用赛道的选择上,后摩智能也做了仔细的考量。据屈艳格介绍,公司成立初期,做了大量的调研,去思考选择什么样的赛道,对数据中心、安防、智能驾驶等都进行了分析。

比如数据中心,这个市场需要大算力,需求量也非常大,尤其是今年大模型迅速发展,未来市场空间会更大。可是分析下来可以发现,数据中心市场90%以上由英伟达的GPU占据,算法迭代快,对英伟达CUDA生态的依赖强。第三方初创企业想进去构建自己的生态,很难。

再比如安防市场,相对来说它对算力的要求比较低,生态依赖度不高,是一个成熟市场。可是,它对算力要求并不高。而后摩智能的核心特点是,容易做大算力的产品,安防市场并不能凸显出公司的优势。

后来确定选择智能驾驶赛道,有两个方面的原因:1、当前智能驾驶是一个发展比较快的行业,每年增速差不多30%以上。尤其现在,我国智能化全球领先,未来市场极其可观。智能驾驶对算力要求很大,L1/L2可能需要几TOPS,到L2++以及未来L4/L5级自动驾驶,它需要的算力会达到上千TOPS,存算一体跟这个市场的需求匹配度很高。

2、虽然智能驾驶现在发展很快,但这个市场刚开始没多长时间。虽然已经有几家巨头企业,包括英伟达、高通、TI,以及国内几家头部企业开始在做,并且取得了不错的成绩。但是相对来说推进的时间还不是很长,整个生态并没有那么成熟,还有去冲刺的机会。

后摩智能推出的首款智能驾驶芯片,是一款通用的产品,它可以像英伟达Orin芯片一样,去适配更多车厂的主流算法。目前已经与新石器、环宇智行等无人车企业达成合作,另外在乘用车方面,也正在与车企业推进测试中。

谈到未来规划,屈艳格表示,公司首先还是会基于SRAM存储介质去进行不断产品优化,面向智能驾驶领域,将这块市场打透,建立起足够高的壁垒。此外还会不断深耕机器人、智能工业、电力、云端推理等领域,去赋能更多的场景。

结尾

可以看到,经过近几年的发展,存算一体已经逐渐在一些场景中得到应用。今年以来,大模型及AIGC迅速发展,它对算力的需求越来越大,而当前传统架构的芯片在性能提升上遇到瓶颈,存算一体在这方面却优势明显,未来将会有很大的应用空间。

虽然存算一体作为一门新技术,在产品和应用的推进上存在挑战。而如今,SRAM已经实现大算力的存算,新型存储介质也在加速推进产业落地。可想而知,未来随着MRAM、RRAM这些新型存储介质的成熟商业化,存算一体的可想像空间将会更大。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SRAM技术
    +关注

    关注

    0

    文章

    4

    浏览量

    1865
收藏 人收藏

    评论

    相关推荐

    未来已来,多传感器融合感知是自动驾驶破局的关键

    /L4级自动驾驶赛跑的元年。 马斯克评论FSD 12.3版本的左转弯操作就像人类司机样。如果FSD 12.3版本成功,基本颠覆目前市场上的智能
    发表于 04-11 10:26

    RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解RADXA微服务器的具体规格: 处理器:BM1684X :高达32Tops INT8峰值
    发表于 02-28 11:21

    iBeLink KS MAX 10.5T大领跑KAS新领域

    有8G的显存,可以处理复杂的算法,提高挖掘稳定性。iBeLink ks max10.5T的超大特点是它的高效节能,它采用了先进的“一体”高通量
    发表于 02-20 16:11

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    关于雅特AT32F403A XMC复用模式驱动SRAM芯片

    描述:AT32F403A引脚比较紧张,XMC(类似于STM32 FSMC)只支持复用模式,就是A0-A15和D0-D15都用个引脚,如果要用,只能用锁地址锁,实现地址线和数据
    发表于 01-04 10:46

    请问AD芯片采集和转换时间怎么啊?

    请问AD芯片采集和转换时间怎么啊?就是输入单片机之前,采集完所有通道并完成转换的时间,以AD7994为例,能不能介绍下?
    发表于 12-21 07:32

    #清华 #芯片 #一体化 清华研制出全球首颗一体芯片

    芯片
    深圳市浮思特科技有限公司
    发布于 :2023年10月10日 18:03:59

    c语言时间for延时,怎么时间?

    c语言时间 for延时,怎么时间?for(i=;;)
    发表于 10-08 07:46

    英码科技精彩亮相火爆的IOTE 2023,多面AIoT产业发展!

    于智慧城市、智慧应急、智慧交通、智慧校园、智慧金融、智慧园区等领域。英码科技“深元”AI引擎为客户提供算法一体化快速生产模式,实实在
    发表于 09-25 10:03

    第四代北斗芯片发布

    国家北斗创新发展、高质量发展进步筑牢了底座。在北斗芯片“硬科技”的加持下,北斗全面千行百业,向着深度应用、大众化应用、规模化发展的方
    发表于 09-21 09:52

    创龙科技位居头版,2023深圳elexcon电子展为智能

    ,面向新能源汽车、智能驾驶、电源与储智能家居、智能制造、智能手机/可穿戴、智慧医疗、智慧零售
    发表于 08-24 11:49

    21.5寸安卓工业一体机 嵌入式工控一体机 微嵌工业平板电脑厂家

    一体
    jf_91874718
    发布于 :2023年07月05日 16:44:25

    国产化一体

    一体
    jf_22764069
    发布于 :2023年06月27日 14:38:48

    扬宇光电人脸测温一体

    一体
    jf_22764069
    发布于 :2023年06月27日 14:36:57

    迅为RK3588开发板应用直播一体机方案带货设备多功能高清大屏便携式直播

    ,并提供非常平稳的操作。 内置独立NPU RK3588集成了瑞芯微第四代具有完全自主知识产权的人工智能运算引擎,在MAC运算单元的利用率及带宽的消耗上提升了30%。6TOPs的NPU
    发表于 05-18 14:23