0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

讨论AI与存储器互连的挑战和解决方案

454398 来源:电子工程专辑 作者:Gary Hilson 2020-12-09 15:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

位置、位置、位置,这并不只是房地产界的核心词。为了满足人工智能AI)和机器学习应用的需求,这个词被越来越多地应用于数据存储,如数据存储的位置以及存放数据的存储器。

但解决这种位置的挑战不只是存储器供应商应做的工作,与AI相关的供应商也扮演着重要角色。尽管存储距离计算越来越近,但解决方案的很大一部分在于存储互连。Rambus研究员Steve Woo最近在AI硬件峰会上主持了一次在线圆桌论坛,讨论了存储器互连的挑战和解决方案,他说:“我们都在为AI的不同方面而工作。”

Marvell的ASIC事业部CTO Igor Arsovski在17年前曾经做过SRAM设计工程师。他说,慕尼黑啤酒节(Oktoberfest)因为新冠肺炎疫情取消了,而把存储互连比做啤酒很合适。参加啤酒节,可以很容易喝到啤酒。“而SRAM就好像近在身边的啤酒一样。它随手可得,不需要耗费多少能量,而且只要您需要,它就在那儿,就像拥有一个不错的高性能加速器。”但是,如果没有足够的存储空间,就需要走远一点,同时也需要花费更多能量来获取它,就好像必须走更远才能买到大桶啤酒一样。

Arsovski 说,对存储器而言,大桶啤酒就好像高带宽存储器(HBM),它正越来越多地被AI所采用。“访问这种存储器需要花费约60倍的能量。那里容量虽然大得多,但访问它的带宽却很少。”将啤酒类比扩展到LPDDR之类的技术,这种技术比SRAM更先进。他说:“LPDDR功耗明显更高,但容量更大。这就像沿着那条路走到您最喜爱的酒吧,在那里有几桶啤酒等着您。”

Arsovski表示,下一代加速器的发展方向是将那些存储器放在加速器正上方,让存储离计算更近。MLCommons执行董事David Kanter补充说,这个啤酒类比概述了不同的封装途径以及在何处安放不同的硅片。MLCommons是一个提供机器学习标准和AI推理基准的组织,其成员涵盖学术界和工业界。他说道:“这使我们对不同的工作负载有非常全面的了解。MLCommons正在开始采取一些措施,其中重点之一就是建立咨询委员会,以吸收特定应用领域的一些资深专家。”

Kanter说,对存储器而言,整个系统环境至关重要。“您必须考虑系统要实现什么,这将决定要考虑的问题。”他说,当涉及到存储器的位置和连接时,芯片、封装和电路板都是必须考虑的要素。“在阵列结构、单元类型以及距离方面,有很多地方可以优化。”

Kanter说,明白哪里需要带宽以及非易失性也是关键的考量因素。“希望这将引导做出正确的选择。”

对于那些传统上并不属于存储系统构建流程的公司而言,这些考量因素至关重要。Google软件工程师Sameer Kumar花费大量时间在编译器和可扩展系统上,这些系统的网络和存储带宽对不同的机器学习模型非常重要,包括其大规模批量操作的能力。他说:“人工智能训练涉及许多存储方面的优化,”这是在编译器中获得极高效率的最关键步骤,它意味着存储也需要更加智能。

Woo认为,数据移动实际上已经开始主宰AI应用的某些阶段,所以存储互连变得越来越重要。“性能和能效成为日益重要的问题”,提高数据速率极具挑战性,因为所有人都希望将数据移动速度加倍,能效也加倍。“我们以前所依赖的许多技巧和技术都已不再适用,或者正在被慢慢淘汰。我们有极好的机会来思考新的体系架构,并在移动数据的方式上进行创新。”

Woo表示,创新不仅在存储器件本身上,而且还包括封装,以及堆叠等新技术。在创新的同时,还要确保数据的安全性,这是Rambus目前越来越关注的。

Rambus感受到业界对3D堆栈的极大兴趣,但如果带宽不随堆栈容量增加而相应增加的话,其可用性会受到限制。(图片来源:Rambus)

Arsovski表示,Marvell花费了大量时间为客户建立AI系统,为客户提供带宽相关信息,如每个芯片边缘有多少带宽可以用于数据移动,以及有多少带宽可以用于访问存储器。他说:“到目前为止,我们已经可以看到,客户需要更多的存储带宽和更多的I / O带宽。如果看看封装级别的互连,可以看到存在很大的不匹配。我们现在已经到达瓶颈,高端芯片-芯片连接的需求压力持续增大。”

Arsovski表示,从存储器的角度来看,对于那些无法在裸片上直接构建AI模型的设计师来说,其下一步考虑应该是HBM或GDDR。但是也有很多转而采用3D堆叠,以尝试获得更大的带宽,因为在芯片边缘移动数据的容量有限。“客户希望得到越来越多的I/O带宽,而我们在边缘数据移动上遇到了瓶颈。”

Kanter说,即使在机器学习的世界中,也存在着“很大的多样性”,这对生态系统既有制约,也有促进,记住这一点很重要。对于常规DRAM来说,随机查找庞大的数据结构不适合单个节点,这意味着如果您想将数据真正保存在存储器中,则需要构建一个非常大的系统集群。他说:“与传统的面向视觉的模型相比,其特征和属性完全不同。在存储方面要牢记这一多样性,这一点非常重要。”

Kanter说,当需要将大量存储和计算整合在一起时,就需要互连了。“要进行大规模训练,迫切需要既适合客户又适合要解决问题的互连方案。”他说,对于前沿应用来说,互连将特别重要。“如果您只想为一个小型网络训练一个GPU,那么关键因素可能就是存储带宽。”

Kumar说,更多的存储带宽可以实现不同种类的优化,但是如果模型特别受存储限制,就有必要引入更多的计算。“如果有更多的存储吞吐量可用,甚至有更多的互连吞吐量可用,将可能会使模型设计更加灵活,而且可以启用新功能,并一起构建各种类型的模型。”

Woo表示,Rambus感受到大家对3D堆栈兴趣浓厚,但随着堆栈越来越高,增加进出堆栈的带宽也变得越来越困难。“如果只是增加堆栈容量,但没有增加相应的带宽,那方案的实用性就成问题了。”

他说,关键点在于寻找合适的方案,既能保持填充频率,又能利用堆叠能效方面的优势,从而使带宽与容量和堆叠之间具有相对恒定的比率。

Kumar和Arsovski都认为需要一个平衡、可扩展的系统,这种系统具有精心设计的软件堆栈。 Arsovski说,“我们所说的是一种可以良好扩展的类脑结构。”它必须低功耗且具有大量连接,而现在,3D堆叠是我们能做到最接近的结构,但仍然存在功耗、封装和机械结构方面的挑战。 “我们需要研究出一个高度并行的系统,其每个层级的功耗都极低,而不必担心要为冷却耗费数千瓦的功率。”

他说,是时候开始寻找适合AI系统的下一个基本构建模块了。“一直以来,我们都采用晶体管作为基本单元,迄今为止,它们都发挥出色。我们通常会依赖我们所知道和喜爱的技术,并且希望它持续发展。但现在我们需要重头开始设计了。”

(参考原文:AI Drives Memory Interconnect Evolution)
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    39

    文章

    7755

    浏览量

    172175
  • 数据存储
    +关注

    关注

    5

    文章

    1037

    浏览量

    53007
  • AI
    AI
    +关注

    关注

    91

    文章

    41059

    浏览量

    302561
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124615
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索FM25V10 1-Mbit Serial (SPI) F-RAM:高性能非易失性存储器解决方案

    探索FM25V10 1-Mbit Serial (SPI) F-RAM:高性能非易失性存储器解决方案 在电子设计领域,选择合适的存储器对于系统的性能和可靠性至关重要。今天,我们将深入探讨英飞凌旗下赛
    的头像 发表于 03-29 14:40 143次阅读

    海康存储亮相CFMS 2026 全场景解决方案赋能AI存储新生态

    与生态重构等多重挑战。海康存储携覆盖消费级、企业级、工规级、车规级的全场景存储解决方案亮相,并重点展示其在数据中心、工业控制、智能汽车、智慧终端等领域的创新技术与落地实践。
    的头像 发表于 03-28 11:28 587次阅读
    海康<b class='flag-5'>存储</b>亮相CFMS 2026 全场景<b class='flag-5'>解决方案</b>赋能<b class='flag-5'>AI</b><b class='flag-5'>存储</b>新生态

    固态变压实时仿真的挑战和解决方案

    变压高开关频率、大拓扑级联特点影响,传统仿真技术难以兼顾精度与实时性,EasyGo实时仿真解决方案为破解这一行业技术瓶颈提供了高效可行的全新路径。一、固态变压
    的头像 发表于 03-20 13:35 449次阅读
    固态变压<b class='flag-5'>器</b>实时仿真的<b class='flag-5'>挑战和解决方案</b>

    慧荣科技于Embedded World 2026展示AI优化的启动存储与企业级解决方案

    的启动存储(Boot Storage)解决方案。与会者可前往1号馆385号展位,了解其面向工业、嵌入式、汽车及数据中心应用的启动存储和主控芯片解决方案。 为工业和数据中心平台打造的可靠
    的头像 发表于 03-11 14:09 257次阅读
    慧荣科技于Embedded World 2026展示<b class='flag-5'>AI</b>优化的启动<b class='flag-5'>存储</b>与企业级<b class='flag-5'>解决方案</b>

    【案例5.1】存储器选型的考虑要点

    【案例5.1】存储器选型的考虑要点某设计,用户接口数据传输速率为10Gbps,每8个字节的数据对应一次查表需求,数据表存储在由DDR4SDRAM组成的存储器中。工程师需综合考虑各方面要求,进行
    的头像 发表于 03-04 17:20 431次阅读
    【案例5.1】<b class='flag-5'>存储器</b>选型的考虑要点

    DRAM动态随机存取存储器DDR2 SDRAM内存解决方案

    在半导体存储领域,DRAM动态随机存取存储器始终是电子设备性能的核心支撑。作为存储解决方案的重要组成部分,DDR2 SDRAM内存解决方案
    的头像 发表于 02-28 16:31 689次阅读

    SK海力士在CES 2026展示面向AI的下一代存储器解决方案

    SK海力士(或‘公司’)6日宣布,公司将于当地时间1月6日至9日,在美国拉斯维加斯举办的“CES 2026”威尼斯人会展中心设立专属客户展馆,并集中展示面向AI的下一代存储器解决方案
    的头像 发表于 01-08 12:57 1956次阅读

    Amphenol Multi-Trak™:下一代高速互连解决方案

    系统时提供了全新的思路和解决方案。下面,我们就来详细了解一下这款产品。 文件下载: Amphenol Commercial Multi-Trak™高速互连解决方案.pdf 一、产品概述 Multi
    的头像 发表于 12-11 15:30 554次阅读

    Amphenol LTW:数据中心互连解决方案的创新先锋

    的产品和技术,在数据中心领域崭露头角。本文将深入介绍Amphenol LTW的相关产品和解决方案,为电子工程师们提供有价值的参考。 文件下载: Amphenol LTW SnapQD液冷连接.pdf 一
    的头像 发表于 12-10 09:30 991次阅读

    ‌面向AI时代的高速互连解决方案:Molex NearStack HD连接系统技术解析

    Molex NearStack HD连接系统是薄型、高密度电缆解决方案,具有64Gbps PAM-4速度,符合PCIe Gen-6标准。该连接系统设计用于内部电缆应用,支持人工智能 (
    的头像 发表于 11-18 09:38 958次阅读

    高速存储器sram,带ECC的异步SRAM系列存储方案

    在要求高性能与高可靠性的电子系统中,存储器的选择往往成为设计成败的关键。Netsol推出的高速异步SRAM系列,凭借其出色的性能表现与独有的错误校正(ECC)能力,为工业控制、通信设备及高精度计算等应用提供了值得信赖的存储解决方案
    的头像 发表于 11-05 16:21 539次阅读

    OTP存储器AI时代的关键作用

    一次性可编程(OTP)非易失性存储器问世已久。与其他非易失性存储技术相比,OTP的占用面积更小,且无需额外的制造工序,因此成为存储启动代码、加密密钥等内容的热门选择。尽管听起来简单,但随着人工智能(
    的头像 发表于 10-21 10:38 1898次阅读
    OTP<b class='flag-5'>存储器</b>在<b class='flag-5'>AI</b>时代的关键作用

    聚焦AI挑战!MPS、安谋科技、Imagination及长江存储分享创新解决方案

    计算需求、能效优化及技术快速迭代成为行业面临的主要挑战。在会上,MPS、安谋科技、Imagination Technologies以及长江存储等企业从不同角度分享了他们的创新解决方案。   MPS:高密度电源模块,
    的头像 发表于 08-26 21:39 5631次阅读
    聚焦<b class='flag-5'>AI</b><b class='flag-5'>挑战</b>!MPS、安谋科技、Imagination及长江<b class='flag-5'>存储</b>分享创新<b class='flag-5'>解决方案</b>

    简单认识高带宽存储器

    HBM(High Bandwidth Memory)即高带宽存储器,是一种基于 3D 堆叠技术的高性能 DRAM(动态随机存取存储器)。其核心设计是通过硅通孔(TSV)和微凸块(Microbump
    的头像 发表于 07-18 14:30 5443次阅读

    微小泄漏零容忍:结束线连接气密性检测的挑战与对策

    我们在使用结束线连接气密检测的时候会遇到很多问题,那在气密检测中遇到这些挑战,我们该如何去解决呢,下面是一些挑战和解决对策:
    的头像 发表于 06-04 14:17 583次阅读
    微小泄漏零容忍:结束线连接<b class='flag-5'>器</b>气密性检测的<b class='flag-5'>挑战</b>与对策