0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于Gen-Z语义存储(memory-semantic)体系架构探讨

454398 来源:电子技术设计 作者:Gary Hilson 2020-10-23 15:38 次阅读

不要与人口学中的千禧世代搞混了,Gen-Z是一种语义存储(memory-semantic)体系架构,它已经发展到了一定程度,需要更好地定义来适应更大规模的规范与标准,例如在数据中心越来越受欢迎的成熟NVM Express和新兴Compute Express Link(CXL)协议。

Gen-Z使用语义存储通信,以最小开销在不同组件的内存之间传送数据,它不仅使存储器件互连,也使处理器和加速器互连,加速器可以减轻CPU的处理压力,越来越受到存储和人工智能等应用的青睐。Gen-Z在资源供应和共享方面更灵活、响应更快,当应用所需资源发生变化时,可以重新配置系统。

与许多体系架构一样,在支持和增强现有系统方面,Gen-Z会尽量使其达到平衡,同时还可以创建新的体系架构。Gen-Z架构强调要弄清谁在做什么。研究机构Coughlin and Associates的总裁Thomas Coughlin说:“这个问题令人困扰,很多事情他们可能都在做重复工作,如果能互通有无,搞清谁在做什么和如何做,并且一起去做,那就太好了。”

Gen-Z之所以能成为主流,一个重要原因就是可以支持不同类型标准化设备的互操作性,其他体系架构(如CXL)的支持者也认同协作的重要性。

“人们采用不同的方式创建网络及包含各种要素(如联网、存储和计算,以及加速器)的架构,我们认为所有这些方式之间的关系都需要讨论清楚。”Coughlin说,“如何使所有这一切协同工作?如何创建最佳的网络和架构,使它们尽可能以有效的方式在本地和远程工作?对NVMe over Fabric与Gen-Z进行区分只是其中的一个例子。”

图1:Gen-Z架构的开发重点是通过下一代器件(如持久性内存)的透明集成实现持续的性能提升,并通过组合式存储器和加速器来充分利用DRAM。(图片来源:Gen-Z联盟)

Gen-Z联盟声称,Gen-Z本身的主要技术优势是能够将DRAM和非易失性存储器及未来的持久性存储技术结合起来,它还使用一种高带宽、低延迟和高效的协议来简化软硬件设计,降低了解决方案的成本和复杂性。与任何新的体系架构一样,Gen-Z的目标是在不降低系统性能的情况下可以灵活扩展,同时保持设计兼容性,以集成到现有平台并与任何必需的软件兼容。

“为实现这一架构,大家必须合作,因此Gen-Z联盟与OpenFabrics联盟(OFA)签署了合作意向书(MOU)。”Gen-Z联盟主席Paul Grun表示,合作对双方都有利。Gen-Z需要在整个架构拓扑上实现类似存储的语义,帮助Gen-Z实现分布式存储架构;OFA的目标则是加速OFA的发展并推进新结构的采用,以形成良好的网络生态系统。“很明显,Gen-Z是下一代架构。”他接着说,但OFA不是标准机构,而是开发者。“我们为他们提供所需的软件来加速架构的开发和采用。”

架构所采用的先进软件可以是任何适合当前和未来高性能计算、云服务和企业级数据中心的API及相关软件,在需要高效联网、超低延迟、更快的存储连接、可扩展并行计算和云服务的场景中使用。Grun说,OFA与具体的架构和供应商无关,它主要关注作为OpenFabrics接口(OFI)一部分的用户模式API(称为libfabricAPI),并对需要公共管理框架的组合式异构网络进行网络管理。

Grun提到,最近宣布的合作意向书拟定,OFA将为Gen-Z提供libfabric程序,使支持libfabric的任何应用或中间件都能轻松使用Gen-Z功能,OFA同时还将研究对libfabric API进行增强的可能性。Gen-Z将是首个用于管理组合式网络的解决方案,这一方案使用DMTF的Redfish标准,由管理框架、“抽象”的架构管理器和特定架构的插件组成。

图2:Gen-Z可以集成到处理器中,而不会影响传统的存储控制器。例如,DDR存储控制器仍将独立为处理器的一部分地址空间提供服务,Gen-Z则将独立为另一部分服务。(图片来源:Gen-Z联盟)

Bowman说,有一些器件,如存储器、高速GPU等,在任何现有的架构上都不能很好地工作,而是需要适合自己的高速率、低延迟安全架构,Gen-Z则反映了这些器件对行业标准架构的需求。他说:“我们发现DDR接口的引脚太多了,希望能够实现一些器件民主,避免所有事务都必须由主机CPU处理。”

Bowman说,作为一种语义存储协议,Gen-Z可通过GPU、AI器件或FPGA等加速器(而非CPU)简单地读写存储空间并获取信息,同时还可以访问本地存储器和Gen-Z上的存储器。“这样,不同的器件就可以共享内存——内存可以分配给器件,也可以由多个器件共享。”

Gen-Z联盟称Gen-Z架构在连接器件和共享内存时表现出极低的延迟,但是速率不如直连到内存快。“从我们的一个演示可以看出,与Gen-Z连接的存储器件延迟降低了5倍,可与一些最快的NVMe器件通信。”他说,目前有两种方法连接到Gen-Z。一种方法是在端点设备中使用本机接口,另一种方法是采用直连到Gen-Z接口的FPGA。

当然,Gen-Z不仅需要适应OFA的发展,也要配合其他架构(如刚起步的CXL和成熟的NVMe over Fabric)的进步。但是正如Grun所指出的,由一家公司来开发其中任何一种架构的成本都太高。如同不应再将存储器和联网分开考虑,所有这些架构也都需要关联在一起。“我认为它就像一张拥有很多重要织线的大挂毯。”
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10412

    浏览量

    206465
  • 加速器
    +关注

    关注

    2

    文章

    741

    浏览量

    36570
  • 数据中心
    +关注

    关注

    15

    文章

    4170

    浏览量

    69822
  • 异构网络
    +关注

    关注

    0

    文章

    19

    浏览量

    9147
  • 非易失性存储器

    关注

    0

    文章

    105

    浏览量

    23236
收藏 人收藏

    评论

    相关推荐

    嵌入式微处理器的体系结构

    嵌入式微处理器的体系结构通常包括核心架构、指令集架构存储体系架构和系统总线
    的头像 发表于 03-29 11:48 300次阅读

    罗彻斯特携手Intelligent Memory提供传统DRAM和NAND存储解决方案

    罗彻斯特电子与Intelligent Memory携手合作,确保为工业应用和嵌入式应用提供传统和成熟的DRAM和NAND存储解决方案。
    的头像 发表于 03-27 09:59 114次阅读

    OpenVINO™协同Semantic Kernel:优化大模型应用性能新路径

    作为主要面向 RAG 任务方向的框架,Semantic Kernel 可以简化大模型应用开发过程,而在 RAG 任务中最常用的深度学习模型就是 Embedding 和 Text completion,分别实现文本的语义向量化和文本生成
    的头像 发表于 03-08 10:41 193次阅读
    OpenVINO™协同<b class='flag-5'>Semantic</b> Kernel:优化大模型应用性能新路径

    【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一本好书

    感谢电子发烧友论坛和电子工业出版社提供的试读机会。 《RISC-V开放架构设计之道》由RISC-V架构的作者、著名的计算机体系架构专家David Patterson亲自主笔撰写。Dav
    发表于 01-23 20:08

    关于修复烘缸轴磨损的探讨

    电子发烧友网站提供《关于修复烘缸轴磨损的探讨.docx》资料免费下载
    发表于 01-05 09:18 0次下载

    EVAL-ADPD105Z-GEN信号是如何引入的,是否自带发光管和接收管?

    想问一下EVAL-ADPD105Z-GEN,这个ADPD105评估板,信号是如何引入的,是否自带发光管和接收管?
    发表于 12-11 06:16

    冯诺依曼架构和哈佛架构有何不同

    冯诺依曼架构是最常见的计算机体系结构之一,最早由冯·诺依曼于1945年提出,又称普林斯顿结构。这种架构中,指令和数据存储在同一个存储器中,使
    的头像 发表于 12-10 14:10 568次阅读
    冯诺依曼<b class='flag-5'>架构</b>和哈佛<b class='flag-5'>架构</b>有何不同

    高通骁龙8Gen3性能如何?

    骁龙8Gen3没有用上3nm工艺,而是从N4升级为性能更强的N4P,性能强了6.6%。骁龙8Gen3这一次首次升级为1+5+2的全新架构,三级缓存从8MB增加至12MB。
    发表于 11-21 12:36 2526次阅读
    高通骁龙8<b class='flag-5'>Gen</b>3性能如何?

    关于对天线近场测量的技术探讨

    电子发烧友网站提供《关于对天线近场测量的技术探讨.pdf》资料免费下载
    发表于 11-10 15:23 0次下载
    <b class='flag-5'>关于</b>对天线近场测量的技术<b class='flag-5'>探讨</b>

    一种物联网智能终端的架构探讨

    电子发烧友网站提供《一种物联网智能终端的架构探讨.pdf》资料免费下载
    发表于 11-07 14:47 0次下载
    一种物联网智能终端的<b class='flag-5'>架构</b><b class='flag-5'>探讨</b>

    探讨STM32H7设备新的架构,外设和系统

    探讨STM32H7xx设备新的架构,外设和系统的块• 结束的时候你将能够• 理解STM32H7新产品特性• 安装开发工具,运行demo,和外设的example• 能够介绍STM32H7xx
    发表于 09-11 06:16

    麒麟9000s和骁龙8gen1参数对比

    。 CPU架构: 首先,麒麟9000s采用了ARM Cortex-A78架构,而骁龙8gen1采用了Kryo 585架构。这意味着麒麟9000s在处理器
    的头像 发表于 08-29 17:33 2.1w次阅读

    A17与骁龙8Gen2对比

    ,以及哪一个更适合你的需求。让我们开始吧! 核心架构 A17是由ARM公司设计的一款处理器,采用了Cortex-A17的架构。它是一款非常高性能的处理器,尤其适合用于高负荷的操作,例如高清游戏。骁龙8Gen2则采用了Kryo 3
    的头像 发表于 08-16 11:47 5527次阅读

    高通骁龙8 Gen4放弃公版:升级自研架构Oryon CPU

    ARM正酝酿对其IP授权模式进行大刀阔斧地改革。 对此,数码闲聊站分享称,ARM授权收紧,高通最快在SM8750也就是骁龙8 Gen4开始使用自研架构Nuvia,2+6 8核设计。 此前,虽然高通骁
    发表于 05-28 08:49

    从计算机体系结构看操作系统

    计算机体系架构(Computer Architecture)泛指计算机硬件系统设计的各个方面,包括指令集架构(Instruction Set Architecture,ISA),微体系
    的头像 发表于 05-09 16:14 512次阅读