0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不只是GPU,内存厂商们的AI野望

E4Life 来源:电子发烧友网 作者:周凯扬 2023-09-01 00:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)在诸多云服务厂商或互联网厂商一头扎进GPU的疯抢潮后,不少公司也发现了限制AI大模型性能或是成本消耗的除了GPU以外,还有内存。内存墙作为横亘在AI计算和HPC更进一步的阻碍之一,在计算量井喷的今天,已经变得愈发难以忽视。所以,在今年的HotChips大会上,内存厂商们也竞相展示自己的内存技术在AI计算上的优势。

三星

三星作为最早一批开始跟进存内计算的公司,早在两年前的HotChips33上,就展示了HBM2-PIM的技术Aquabolt-XL。三星在去年底展示了用PIM内存和96个AMD Instinct MI100 GPU组建的大规模计算系统,并宣称这一配置将AI训练的速度提高了近2.5倍。

而今年的HotChips上,三星也着重点明了PIM和PNM技术在生成式AI这类热门应用上的优势。三星认为在ChatGPT、GPT-3之类的应用中,主要瓶颈出现在生成阶段的线性层上,这是因为GPU受到了内存限制且整个过程是线性顺序进行的。

在三星对GPT的分析中,其主要由概括和生成两大负载组成,其中概括考验的是计算单元的性能,而生成则考验的是内存的性能。而生成占据了绝大多数的运算次数和耗时,其中占据了60%到80%延迟的GEMV(矩阵向量操作)也就成了三星试图用PIM和PNM攻克的目标。

根据三星的说法,像GPT这类Transformer架构的模型,都可以将多头注意力(MHA)和前馈神经网络(FFN)完全交给PIM或PNM,完全利用他们的所有带宽,从而减少在推理上所花费的时间和能耗。三星也在单个AMD MI100-PIM的GPU上进行了试验,得出运行GPT模型时,在HBM-PIM的辅助下,能效是GPU搭配传统HBM的两倍,性能同样提升至两倍以上。

wKgZomTwaRqAN2Y0AAEQ1l7kLeE723.jpg
LPDDR-PIM概念 / 三星

除了HBM-PIM外,这次三星还展示了最新的LPPDR-PIM概念。除了云端生成式AI需要存内计算的辅助外,诸如智能手机这样的端侧生成式AI概念也被炒起来,所以LPPDR-PIM这样的存内计算技术,可以进一步保证续航的同时,也不会出现为了带宽内存使用超量的情况。

SK海力士

另一大韩国内存巨头SK海力士也没有闲着,在本次HotChips大会上,他们展示了自己的AiM存内加速器方案。相较三星而言,他们为生成式AI的推理负载准备的是基于GDDR6的存内计算方案。

GDDR6-AiM采用了1y的制造工艺,具备512GB/s内部带宽的同时,也具备32GB/s的外部带宽。且GDDR6-AiM具备频率高达1GHz的处理单元,算力可达512GFLOPS。GDDR6-AiM的出现,为存内进行GEMV计算提供了端到端的加速方案,比如乘法累加和激活函数等操作都可以在内存bank内同时进行,单条指令实现全bank操作提供更高的计算效率。

同时,SK海力士也已经考虑到了AiM的扩展性问题,比如单个AiM卡中集成了8个AiM封装,也就是8GB的容量和256个处理单元。但这类扩展方案最大的问题还是在软件映射、硬件架构和接口上,这也是绝大多数集成存内计算的新式内存面临的问题。

wKgaomTwaSaAfbrEAAGKrRvOuwQ093.jpg
AiM系统扩展性验证Demo / SK海力士


而SK海力士已经给出了这方面的解决方案,比如专门针对AiM的Tiling、基于AiM架构的控制器、路由和ALU等等。他们还展示了在两个FPGA上结合GDDR6-AiM的Demo,以及用于LLM推理的软件栈。与此同时,他们也还在探索AiM的下一代设计,比如如何实现更高的内存容量,用于应对更加庞大的模型。

写在最后

无论是三星还是SK海力士都已经在存内计算领域耕耘多年,此次AI热来势汹汹,也令他们研发速度进一步提快。毕竟如今能够解决大模型训练与推理的耗时与TCO的硬件持续大卖,如果存内计算产品商业化量产落地进展顺利,且确实能为AI计算带来助力的话,很可能会小幅提振如今略微萎缩的内存市场。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5102

    浏览量

    134485
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为啥 AI 计算速度这么惊人?—— 聊聊 GPU内存与并行计算

    提到AI,大家常说它“算得快”,其实是指AI能在眨眼间处理海量数据。可它为啥有这本事?答案就藏在“GPU+高速内存+并行计算”这trio(组合)里。咱们可以把
    的头像 发表于 12-05 14:35 316次阅读
    为啥 <b class='flag-5'>AI</b> 计算速度这么惊人?—— 聊聊 <b class='flag-5'>GPU</b>、<b class='flag-5'>内存</b>与并行计算

    不只是备用电池!读懂UPS工作原理,才知道如何保护贵重电器。

    UPS
    上海优比施电子科技有限公司
    发布于 :2025年11月25日 09:08:12

    浅谈研华iEMS.AI Agent能源智能体管理平台

    近日,研华 iEMS.AI Agent能源智能体专题直播圆满落幕!这场聚焦工业级智能升级的分享,带大家解锁了 AI 驱动的全新可能 —— 它不只是一套能碳AI管理工具,更是一个具备强大
    的头像 发表于 11-24 15:31 316次阅读
    浅谈研华iEMS.<b class='flag-5'>AI</b> Agent能源智能体管理平台

    开创视觉方案新范式!INDEMIND四目空间智能方案让导航从追求“精准”迈向“智能协同”

    导航的终点,不只是“精准移动”,而是空间理解与决策。
    的头像 发表于 11-07 17:09 2105次阅读
    开创视觉方案新范式!INDEMIND四目空间智能方案让导航从追求“精准”迈向“智能协同”

    储能,不只是存电那么简单

    一、到底啥是储能? 一句话概括:储能,就是把能量先存起来,等到需要的时候再拿出来用的技术。 您可以把它想象成一个超级“能量银行”或“能量充电宝”。 充电(储存能量):当能量充足、便宜甚至免费时(比如阳光明媚、风力强劲的白天,或者深夜用电低谷期),把多余的电能或其他形式的能量储存起来。 放电(释放能量):当能量短缺、昂贵或急需时(比如阴天无风、夜晚用电高峰期,或者突然停电),把储存的能量释放出来使用。 这个
    的头像 发表于 11-06 16:49 625次阅读
    储能,<b class='flag-5'>不只是</b>存电那么简单

    《哪吒2》与国产超高清标准突围

    这已经不只是技术的一小步,而是中国影像标准走向更广阔市场的一次切实尝试
    的头像 发表于 10-29 16:08 776次阅读
    《哪吒2》与国产超高清标准突围

    设备突然停机亏哭?智能系统实时监测 + AI 预警,把故障掐在萌芽里

    过去设备管理是 “人跟着设备转”,现在靠智能系统 “系统跟着数据转”—— 实时监测让异常无处藏,AI 预警让故障不突袭。对企业来说,省下的不只是维修费,更是宝贵的生产时间。
    的头像 发表于 10-09 10:39 200次阅读
    设备突然停机亏哭?智能系统实时监测 + <b class='flag-5'>AI</b> 预警,把故障掐在萌芽里

    科普:什么AI 内存技术

    问题。 为什么 AI 内存很重要? 在 AI 模型训练和推理过程中,大量的数据需要从内存传输到处理器(如 GPU 或 TPU)进行计算。传统
    的头像 发表于 09-03 15:44 775次阅读

    一颗 M12,见工业人心:从选型到价值的思考

    一个小小的 M12,可能只是机器上的一个零件,但它承担着数据、信号、动力的流通。 工程师的责任,不只是把它做对,更是让它在各种环境里都能“活得长久”。 这背后,不只是技术,还有对客户、对产业、对社会的那份责任。
    的头像 发表于 08-12 15:34 557次阅读
    一颗 M12,见工业人心:从选型到价值的思考

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    工程师”的每一步我们相信,未来的AI系统,不只是云端模型的胜利,更是每一个工程细节的胜利。每一个能调硬件、懂系统、会部署的工程师,都是这个AI时代的“产品设计师”。AI的未来,属于那些
    发表于 07-30 16:15

    既是工具人也是情绪搭子,INDEMIND助力打造陪伴机器人新范式!

    陪伴机器人,不只是玩具!
    的头像 发表于 06-20 16:39 374次阅读

    安全地毯不只是地毯,它是你的第二道保险

    保护装置
    jf_18500570
    发布于 :2025年02月15日 10:42:13

    AI“神助攻”!又一家国产GPU厂商启动IPO,数量增至5家

    电子发烧友网综合报道,前段时间已有三家GPU厂商相继办理备案登记,启动A股IPO进程,包括壁仞科技、摩尔线程、沐曦,还有AI算力芯片厂商燧原科技。如今又有一家
    发表于 02-12 01:21 1311次阅读
    <b class='flag-5'>AI</b>“神助攻”!又一家国产<b class='flag-5'>GPU</b><b class='flag-5'>厂商</b>启动IPO,数量增至5家

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1273次阅读

    GPU是如何训练AI大模型的

    AI模型的训练过程中,大量的计算工作集中在矩阵乘法、向量加法和激活函数等运算上。这些运算正是GPU所擅长的。接下来,AI部落小编带您了解GPU是如何训练
    的头像 发表于 12-19 17:54 1360次阅读