0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存内计算并不满足于现有的算力

E4Life 来源:电子发烧友网 作者:周凯扬 2022-05-11 00:08 次阅读

谈到存内计算,大部分人的第一印象就是超低功耗和大算力。存内计算技术打破了冯诺依曼架构的限制,冲破了内存墙,为半导体产业带来了新的创新。但你可能会问,存内计算的应用场景到底有哪些呢?

边缘计算的下一步

边缘计算可以说是众多存内计算技术与公司走的第一步,存内计算凭借其低功耗的特性,可穿戴等端侧设备可以说是为该技术量身定制的。在其架构的优越性之下,存内计算又比一众传统边缘AI芯片有着更加可观的算力。所以,对于智能手表、智能眼镜这类对功耗需求高,又有一定AI计算需求的应用来说,存内计算芯片无疑是不二之选。

不过如今的MCU已经将功耗降到了极低的水准,部分也能完成一些简单的AI运算,如果仅仅是在语音识别、事件检测这些应用上来竞争的话,即便这些存内计算有优势,可能在实际使用过程中,除了续航之外,用户的切身感知到的变化会比较小。

WTM2101存内计算芯片 / 知存科技


但边缘计算并不只局限于此,还有图像处理这一老大难亟待解决,这一应用相比上述那些又有着更高的算力要求。国内领先的存内计算公司知存科技近日透露,他们正在打造算力更强的下一代存内计算芯片就是面向超清视频处理的,根据其给出的演示所示,该芯片主要针对AI插帧、AI超分辨率、AI视频降噪和AI高动态分辨率,这些在边缘端感知更加明显的AI应用。

而以上这些AI应用,也仅仅只是存内计算往智能手机等消费级边缘端走的下一步,边缘AI芯片的终极目标都是自动驾驶。如若能做到更高的算力,存内计算芯片就有机会冲进汽车市场,与自动驾驶芯片的玩家硬碰硬。

超越GPU的算力

既然存内计算已经证实了自己在边缘端的算力优势,那有没有机会与GPU这类算力猛禽一决高下呢?我们以波动仿真为例,波动仿真在许多应用中都有普及,比如医学影像、石油勘探、减轻地震灾害以及国防系统等。然而大部分应用在使用波动仿真时,都要用到超级计算机对波动方程多重求解。虽然这类应用不像可穿戴一样,对于成本和体积要求不高,但对于速度和能耗还是比较重视的。

目前主导的波动仿真解决方案还是CPU和GPU,但由于本身的并行性缺失,即便是高端的CPU运行再小的问题,也需要大量时间才能完成计算。而GPU凭借其巨大的内存带宽优势,无疑拥有着更高的速度。即便如此,在实际应用中,波动仿真是一个极端的数据移动过程,GPU依然会遇到瓶颈,即便几百GB/s的内存带宽没法免受影响,最终导致用于数据移动的功耗甚至高于计算的功耗。

而存内计算可以减少处理器之间的数据移动,因为它消除了片外与片内存储之间的数据移动,但存内之间的数据移动依然是一大问题。埃克森美孚的研究人员就想出了Wave-PIM这种存内计算方案,利用超大规模集成电路常用的H树架构,来减少内存区块之间数据移动的延迟。他们以900GB/s带宽的16GB HBM2内存进行模拟,得出了52.8TFLOPS(FP32)的成绩,超过了Tesla V100 GPU。这证明了存内计算芯片,即使是在服务器级和HPC级的应用上,也有着独到的优势。

UPMEM PIM / UPMEM


不过如今GPU内存带宽已经随着HBM3和英伟达的H100芯片做到了3TB/s,而业界目前在内存带宽上占优的存内计算方案,法国公司UPMEM的DDR4 PIM,也只做到了2.5TB/s。哪怕存内计算有着功耗上的巨大优势,但性能上要想进一步超越GPU,还是需要更先进的内存技术和更多的架构创新。好在如今越来越多的公司开始走上存内计算的商业化尝试,存储厂商们虽然还没有确定走这一方向,但存内计算与其发展技术并无冲突,而且从生产创新和投资方向来看,他们已经开始布局这一技术了,未来高性能计算上很有可能出现存储厂商与GPU厂商互卷的情况。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 半导体产业
    +关注

    关注

    6

    文章

    494

    浏览量

    34033
  • 边缘计算
    +关注

    关注

    22

    文章

    2802

    浏览量

    46011
  • 算力
    +关注

    关注

    1

    文章

    659

    浏览量

    14349
收藏 人收藏

    评论

    相关推荐

    C语言生成与计数三位数的方法

    程序分析:可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去 掉不满足条件的排列。
    的头像 发表于 03-25 10:31 210次阅读

    如何在Altium软件中建立异形板框的内缩和外扩呢?

    当板子不满足pcb设计的要求需要修改尺存,由于异性板框都是结构工程师绘制且比较麻烦,所以重新绘制是不太现实的,但是AD软件可以实现在原有的板框上进行内缩和外扩。
    的头像 发表于 03-17 09:53 237次阅读
    如何在Altium软件中建立异形板框的内缩和外扩呢?

    iBeLink KS MAX 10.5T大领跑KAS新领域

    —KHeavyHash。在市场上,有一款挖掘机可以满足这个要求,那就是iBeLink ks max 10.5T。 iBeLink ks max 10.5T是一款专为Kaspa挖掘而设计的挖掘机,它的
    发表于 02-20 16:11

    在TC397的ASCLIN SPI Master Timing表格中,控制器所需要的最小setup time大于最小clock period,这是不满足时序要求的?

    如图所示,在TC397的ASCLIN SPI Master Timing表格中,控制器所需要的最小setup time大于最小clock period,这是不满足时序要求的,请问datasheet是否有误?
    发表于 01-29 08:00

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    AD9681输出赋值不满足LVDS电平要求怎么处理?

    各位大神,本人在使用AD9681芯片时遇到一个奇怪的问题,一共使用了12片AD9681,其中有几片AD9681输出电平(LVDS接口)不满足要求。 具体情况如下:AD转换以后的数据通过FPGA进行
    发表于 12-06 06:13

    AD5521可以设计满足1~2GHz宽范围的阻抗匹配吗?

    您好! 我的设计是需要满足在1~2GHz的低噪声放大,当我选用了ADL5521后,在ADL5521datasheet发现典型电路做输入匹配时貌似并不满足在1~2GHz宽范围
    发表于 11-17 07:51

    如何播放SD卡中的AMR文件

    : NuTiny-EVB-NUC505 v1.4 或以后 示范代码是演示如何播放SD卡中的AMR文件。 您可以在下列时间下载样本代码http://www.nuvoton.com
    发表于 08-30 07:29

    如何播放SD卡中的AMR文件

    : NuTiny-EVB-NUC505 v1.4 或以后 示范代码是演示如何播放SD卡中的AMR文件。 您可以在下列时间下载样本代码http://www.nuvoton.com
    发表于 08-22 07:25

    REPEAT:不满足条件时执行

    使用“不满足条件时执行”指令可以重复执行程序循环,直至不满足执行条件为止。该条件是结果为布尔值(TRUE 或 FALSE)的表达式。可以将逻辑表达式或比较表达式作为条件。
    的头像 发表于 07-12 09:50 610次阅读

    PCB拼版的原因和适用方式

    拼版主要是为了满足生产的需求,有些PCB板太小,不满足做夹具的要求,所以需要拼在一起进行生产。
    发表于 07-07 09:48 888次阅读
    PCB拼版的原因和适用方式

    京东方柔性OLED累计产值已超1000亿元

    企业的发展需要自我升级,我们的行业伙伴不满足于现有领域的成就,以开放的视野,开创新高地。海信以十年为跨度,做好每一帧画面,凭借画质完美呈现,树立行业标准;BYD洞察全球经济格局的变化,凭借技术创新海外快速出圈,积极卡位;
    的头像 发表于 06-29 15:28 387次阅读
    京东方柔性OLED累计产值已超1000亿元

    西门子博途SCL:WHILE:满足条件时执行

    使用“满足条件时执行”指令可以重复执行程序循环,直至不满足执行条件为止。该条件是结果为布尔值(TRUE 或 FALSE)的表达式。可以将逻辑表达式或比较表达式作为条件。
    的头像 发表于 06-27 16:42 1705次阅读

    如何为现有的eeprom代码添加保留状态?

    如何为现有的 eeprom 代码添加保留状态
    发表于 05-15 07:10

    WHILE ...ENDWHILE:编程设定当型循环 .EXIT:离开循环,无条件退出循环.

    当型循环。一直重复指令块直到满足了特定条件的循环。如果不满足条件,则用 ENDWHILE 后的下一个指令继续程序。在每次循环执行之前检查条件。如果从一开始就不满足条件,则不执行指令块。循环可嵌套。在循环已嵌套时,则首先完整地执行
    的头像 发表于 05-12 15:57 1332次阅读
    WHILE ...ENDWHILE:编程设定当型循环 .EXIT:离开循环,无条件退出循环.