0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存内计算并不满足于现有的算力

E4Life 来源:电子发烧友网 作者:周凯扬 2022-05-11 00:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谈到存内计算,大部分人的第一印象就是超低功耗和大算力。存内计算技术打破了冯诺依曼架构的限制,冲破了内存墙,为半导体产业带来了新的创新。但你可能会问,存内计算的应用场景到底有哪些呢?

边缘计算的下一步

边缘计算可以说是众多存内计算技术与公司走的第一步,存内计算凭借其低功耗的特性,可穿戴等端侧设备可以说是为该技术量身定制的。在其架构的优越性之下,存内计算又比一众传统边缘AI芯片有着更加可观的算力。所以,对于智能手表、智能眼镜这类对功耗需求高,又有一定AI计算需求的应用来说,存内计算芯片无疑是不二之选。

不过如今的MCU已经将功耗降到了极低的水准,部分也能完成一些简单的AI运算,如果仅仅是在语音识别、事件检测这些应用上来竞争的话,即便这些存内计算有优势,可能在实际使用过程中,除了续航之外,用户的切身感知到的变化会比较小。

WTM2101存内计算芯片 / 知存科技


但边缘计算并不只局限于此,还有图像处理这一老大难亟待解决,这一应用相比上述那些又有着更高的算力要求。国内领先的存内计算公司知存科技近日透露,他们正在打造算力更强的下一代存内计算芯片就是面向超清视频处理的,根据其给出的演示所示,该芯片主要针对AI插帧、AI超分辨率、AI视频降噪和AI高动态分辨率,这些在边缘端感知更加明显的AI应用。

而以上这些AI应用,也仅仅只是存内计算往智能手机等消费级边缘端走的下一步,边缘AI芯片的终极目标都是自动驾驶。如若能做到更高的算力,存内计算芯片就有机会冲进汽车市场,与自动驾驶芯片的玩家硬碰硬。

超越GPU的算力

既然存内计算已经证实了自己在边缘端的算力优势,那有没有机会与GPU这类算力猛禽一决高下呢?我们以波动仿真为例,波动仿真在许多应用中都有普及,比如医学影像、石油勘探、减轻地震灾害以及国防系统等。然而大部分应用在使用波动仿真时,都要用到超级计算机对波动方程多重求解。虽然这类应用不像可穿戴一样,对于成本和体积要求不高,但对于速度和能耗还是比较重视的。

目前主导的波动仿真解决方案还是CPU和GPU,但由于本身的并行性缺失,即便是高端的CPU运行再小的问题,也需要大量时间才能完成计算。而GPU凭借其巨大的内存带宽优势,无疑拥有着更高的速度。即便如此,在实际应用中,波动仿真是一个极端的数据移动过程,GPU依然会遇到瓶颈,即便几百GB/s的内存带宽没法免受影响,最终导致用于数据移动的功耗甚至高于计算的功耗。

而存内计算可以减少处理器之间的数据移动,因为它消除了片外与片内存储之间的数据移动,但存内之间的数据移动依然是一大问题。埃克森美孚的研究人员就想出了Wave-PIM这种存内计算方案,利用超大规模集成电路常用的H树架构,来减少内存区块之间数据移动的延迟。他们以900GB/s带宽的16GB HBM2内存进行模拟,得出了52.8TFLOPS(FP32)的成绩,超过了Tesla V100 GPU。这证明了存内计算芯片,即使是在服务器级和HPC级的应用上,也有着独到的优势。

UPMEM PIM / UPMEM


不过如今GPU内存带宽已经随着HBM3和英伟达的H100芯片做到了3TB/s,而业界目前在内存带宽上占优的存内计算方案,法国公司UPMEM的DDR4 PIM,也只做到了2.5TB/s。哪怕存内计算有着功耗上的巨大优势,但性能上要想进一步超越GPU,还是需要更先进的内存技术和更多的架构创新。好在如今越来越多的公司开始走上存内计算的商业化尝试,存储厂商们虽然还没有确定走这一方向,但存内计算与其发展技术并无冲突,而且从生产创新和投资方向来看,他们已经开始布局这一技术了,未来高性能计算上很有可能出现存储厂商与GPU厂商互卷的情况。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 半导体产业
    +关注

    关注

    6

    文章

    512

    浏览量

    35550
  • 边缘计算
    +关注

    关注

    22

    文章

    3577

    浏览量

    53801
  • 算力
    +关注

    关注

    2

    文章

    1773

    浏览量

    16857
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    退烧级高速信号神器|泰克DSA8200 藏在实验室的细节猛兽

    发烧圈玩到深处,早已不满足于表面参数的堆砌,对设备的细节解析、稳定性有着近乎苛刻的追求。在高速信号测试领域,泰克DSA8200绝对算得上一款能让发烧级工程师“退烧”的经典机型,没有花哨的噱头,仅凭扎实的性能和细腻的解析,在光
    的头像 发表于 05-14 14:29 213次阅读
    退烧级高速信号神器|泰克DSA8200 藏在实验室的细节猛兽

    拆解一体技术瓶颈,亿铸科技如何逐个突破

    搬运,不仅造成带宽与时延瓶颈,还产生极高额外能耗。行业内一个公认的观点是:当前 AI 计算中数据搬运成本已远超计算本身成本,存储墙、能耗墙成为制约的两大核心瓶颈。
    的头像 发表于 05-14 09:51 227次阅读

    中科曙光scaleX40超节点革新AI协同

    在当前时代,以Token(词元)为代表的需求已成为行业核心刚需,而稳定、高效的运转,
    的头像 发表于 03-28 15:46 1796次阅读

    曙光存储两大核心技术与全栈产品矩阵推动范式革新

    当AI大模型参数规模迈入万亿级别,万卡级超集群已成为前沿AI研发与应用的核心载体。然而澎湃的背后,数据速度正成为关键瓶颈,
    的头像 发表于 01-23 11:37 956次阅读

    2025年曙光存储以先进构建开放的底座并加速AI进化

    数据存储作为AI基础设施的重要组成,战略价值日益凸显。2025年,曙光存储以先进构建开放的底座、加速AI进化,稳步推进技术创新、产品上新、平台创新,从产业协同到生态共建,实现从
    的头像 发表于 01-07 09:39 753次阅读

    智能为何必须先进

    作为东数西战略的关键枢纽,中国移动呼和浩特数据中心不仅是中国移动“4+N+31+X”网络中规模最大、技术最先进、保障最完备的中心节点,也是推动绿色低碳与智能计算融合发展的标志性工
    的头像 发表于 12-18 17:40 1284次阅读

    交换机组网与PON组网哪个好?

    随着GPON产业链的不断成熟,以及“宽带中国”等产业政策的推动,我国固定宽带接入速率和普及程度逐年提高。 可以说,PON(无源光网络)组网已经在运营商市场取得了阶段性成功,然而PON组网并不满足于
    的头像 发表于 12-17 10:00 463次阅读
    交换机组网与PON组网哪个好?

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    关于综合保持时间约束不满足的问题

    1、将 nuclei-config.xdc 和 nuclei-master.xdc 加入到项目工程中,综合得到时序约束报告如下: 保持时间约束不满足,分析原因,发现所有不满足均出现在
    发表于 10-24 07:42

    天波科普:超过30T的边缘计算服务器可以做什么?

    网关的能力边界,也涉及到高低。那么,目前边缘计算服务器的到多少算高呢?以广东天波AI边缘计算
    的头像 发表于 09-28 11:18 925次阅读
    天波科普:<b class='flag-5'>算</b><b class='flag-5'>力</b>超过30T的边缘<b class='flag-5'>计算</b>服务器可以做什么?

    与电力的终极博弈,填上了AIDC的“电力黑洞”

    ),专注提供人工智能训练与推理所需的服务、数据服务和算法服务。AIDC采用异构计算架构,结合GPU、FPGA、ASIC等多种AI加速芯片,形成高并发分布式系统,以
    的头像 发表于 09-22 02:43 9239次阅读

    一文看懂“一体”

    今天这篇文章,我们来聊一个最近几年很火的概念——一体。为什么会提出“一体”?一体,英
    的头像 发表于 08-18 12:15 1755次阅读
    一文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b>一体”

    之后看,英韧科技洞庭-N3X SSD推动AI和边缘计算存储升级

    洞庭-N3X以前所未有的速度和效率重新定义了数据存储,契合AI服务器和AIPC的发展需求,为移动计算、边缘计算和实时分析领域的下一波创新浪潮提供了动力。01在人工智能(AI)高速发展的浪潮中,数据
    的头像 发表于 08-11 10:12 1464次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>之后看<b class='flag-5'>存</b><b class='flag-5'>力</b>,英韧科技洞庭-N3X SSD推动AI和边缘<b class='flag-5'>计算</b>存储升级

    平衡”有多重要?

    。而决定这种配合效率的关键指标,正是我们今天要聊的“比”。什么是比?比=
    的头像 发表于 07-11 14:06 938次阅读
    “<b class='flag-5'>算</b><b class='flag-5'>存</b>平衡”有多重要?

    华为AI WAN智IP广域网助力互联网建设

    近期,NIDA发布的《工信部首提数据通信产业,赋能互联网新征程》一文引发了行业关注。文章解读工信部最新发布的《互联互通行动计划》,并指出:数据通信产业作为
    的头像 发表于 06-11 11:21 1359次阅读