0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

魏少军、刘雷波团队提出了DIMM间广播技术

SoC芯片 来源:量子位 作者:量子位 2021-07-02 16:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2021年6月14日~6月17日,第48届国际计算机体系结构大会(ISCA)通过线上模式顺利召开。清华大学魏少军、刘雷波教授团队作了题为“ABC-DIMM: Alleviating the Bottleneck of Communication in DIMM-based Near Memory Processing with Inter-DIMM Broadcast”的学术报告。

该报告针对DIMM(双列直插式存储模块)近存计算架构的通信瓶颈问题,提出了基于DIMM间广播技术的通信优化方法。该方法充分利用了内存总线广播的可扩展性以及广播机制的广泛适用性,为DIMM近存计算的通信优化提供了强有力的新工具。

报告人孙伟艺是论文第一作者,目前正在清华大学集成电路学院攻读博士学位。论文通讯作者是刘雷波教授,主要合作者还有李兆石、尹首一等。

当前,随着数据密集型应用的广泛部署,传统主存系统已难以应对日益增长的容量和带宽需求。为应对这一挑战,诸多近存计算架构被相继提出,其中基于DIMM的近存计算架构是公认最具潜力的架构之一。

该架构把计算逻辑集成到DIMM的缓存芯片上,通过让内存通道内多个DIMM并行访存和计算,实现较高的总访存带宽,从而以较低的设计与生产代价获得较高的性能提升潜力。

然而,DIMM近存计算系统的性能提升依赖于DIMM数量的增加,但现有DIMM间基于内存总线的点对点通信机制却可能严重制约系统性能相对于DIMM数量的可扩展性。

具体来说,当一个内存通道内DIMM数量增加时,每个DIMM分配到的平均点对点通信带宽迅速减小,对于许多重要的数据密集型应用,各个DIMM和CPU之间的通信主导了程序的运行时间,极大限制了系统的整体性能。

针对该问题,魏少军、刘雷波团队提出了DIMM间广播技术。

从硬件角度来看,总线系统在物理层面上天然支持广播,且主存总线的有效广播带宽随着DIMM数量的增加而自然扩展。而从软件角度来看,大量数据密集型应用都能以“广播主导”的方式实现。

基于上述想法,团队设计了ABC-DIMM系统,通过在主存中实现并利用“DIMM间广播”来消除DIMM近存计算架构中的通信瓶颈。该系统由三部分构成。

首先,团队设计了指导程序员以广播主导方式实现各类应用的“广播-计算”编程框架,从而让软件能够充分利用“DIMM间广播”来优化通信。它通过分割输出来划分任务,而任务间的通信则由输入数据的广播所主导。

其次,团队提供了“内存通道内”和“内存通道间”的完整“DIMM间广播”机制,利用这些机制,“广播-计算”框架在多内存通道下的通信可以得到高效的实现。

最后,团队为“DIMM间广播”机制提供了全栈式的硬件和API设计。为使系统实现尽可能地简单和低廉,团队将设计开销和范围成功控制在了DIMM缓存芯片以及CPU的内存控制器之内。

具体而言,通过在缓存芯片中加入指令翻译模块,“DIMM间广播”能够在不更改DRAM芯片的前提下以新DDR指令的形式融入主存系统中。此外,通过对内存控制器的有限修改以及相应的API设计,“DIMM间广播”能够在不更改ISA的前提下被软件有效使用。

模拟评估显示,ABC-DIMM的平均性能分别达到了两个主流基线近存系统性能的2.50倍和2.93倍。

过去10余年,魏少军、刘雷波教授团队在软件定义芯片领域取得了多项重要技术突破,关键技术在多项国家重大工程中得到批量应用,曾获国家技术发明二等奖、教育部技术发明一等奖、电子学会技术发明一等奖、中国发明专利金奖、世界互联网大会15项世界互联网领先科技成果等。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54821

    浏览量

    472111
  • cpu
    cpu
    +关注

    关注

    69

    文章

    11394

    浏览量

    226796
  • DDR
    DDR
    +关注

    关注

    11

    文章

    765

    浏览量

    69786
  • DIMM
    +关注

    关注

    0

    文章

    41

    浏览量

    10223

原文标题:克服DIMM近存计算系统的通信瓶颈,清华软件定义芯片团队提出DIMM间广播技术

文章出处:【微信号:gh_9d9a609c9302,微信公众号:SoC芯片】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深入剖析DDR SDRAM REGISTERED DIMM:从特性到应用

    深入剖析DDR SDRAM REGISTERED DIMM:从特性到应用 在电子设备的世界里,内存模块扮演着至关重要的角色。DDR SDRAM REGISTERED DIMM作为一种高性能的内存
    的头像 发表于 06-06 15:20 219次阅读

    :半导体产业加速发展,松山湖IC论坛成中国IC产业试金石

    多家企业带来自家面向“AI眼镜”的创新IC新品推介。   中国半导体行业协会IC设计分会理事长表示,此前我们曾预测,全球半导体产业与中国半导体市场规模将在2030年分别达到1万亿美元和1万亿人民币。然而,产业加速发展的态势
    的头像 发表于 06-03 10:38 5110次阅读
    <b class='flag-5'>魏</b><b class='flag-5'>少</b><b class='flag-5'>军</b>:半导体产业加速发展,松山湖IC论坛成中国IC产业试金石

    200PIN DDR2 667 SO - DIMM 512MB内存模块技术解析

    200PIN DDR2 667 SO - DIMM 512MB内存模块技术解析 在电子设计领域,内存模块是系统性能的关键组件之一。今天,我们来深入解析一款200PIN DDR2 667 SO
    的头像 发表于 05-12 16:40 251次阅读

    200PIN DDR2 800 SO - DIMM 2048MB内存模块技术剖析

    200PIN DDR2 800 SO - DIMM 2048MB内存模块技术剖析 在电子设备的设计中,内存模块的性能和特性对整个系统的运行起着至关重要的作用。今天我们就来深入剖析一款由
    的头像 发表于 05-12 15:35 164次阅读

    Apacer 2GB Registered DDR3 SDRAM DIMM 技术剖析

    Apacer 2GB Registered DDR3 SDRAM DIMM 技术剖析 在电子工程领域,内存模块的性能与设计对于整个系统的运行起着至关重要的作用。今天,我们就来深入剖析 Apacer
    的头像 发表于 05-12 15:20 143次阅读

    240PIN DDR2 800 Unbuffered DIMM 2GB内存模块技术解析

    240PIN DDR2 800 Unbuffered DIMM 2GB内存模块技术解析 在当今的电子设备中,内存模块的性能往往是影响系统整体性能的关键因素之一。今天,我们就来深入剖析一款
    的头像 发表于 05-12 15:10 154次阅读

    Apacer 2GB DDR2 DIMM 内存产品技术解析

    Apacer 2GB DDR2 DIMM 内存产品技术解析 在当今的电子设备中,内存的性能和稳定性对于系统的运行起着至关重要的作用。Apacer 的 2GB DDR2 DIMM 内存产品就是一款具有
    的头像 发表于 05-12 14:55 167次阅读

    探索ADATA工业级DDR5 U - DIMM内存模块:性能与应用的完美结合

    探索ADATA工业级DDR5 U - DIMM内存模块:性能与应用的完美结合 在当今科技飞速发展的时代,电子设备对内存的性能和稳定性提出了更高的要求。ADATA工业级DDR5 U - DIMM内存
    的头像 发表于 05-09 12:40 333次阅读

    探秘ADATA工业级DDR4 ECC SO - DIMM内存模块

    探秘ADATA工业级DDR4 ECC SO - DIMM内存模块 在当今数字化飞速发展的时代,服务器、数据中心、边缘计算等领域对内存的性能、稳定性和可靠性提出了更高的要求。ADATA工业级DDR4
    的头像 发表于 05-09 12:15 324次阅读

    倒计时3天丨教授主旨报告主题、数据出炉

    一场盛会,解读全年IC产业脉络。 一个平台,链接上下游核心技术。 一众大咖,分享最前沿热点趋势。 2025成都ICCAD-Expo,你来了吗? ICCAD-Expo 2025(三十一届集成电路设计业
    的头像 发表于 11-17 17:03 889次阅读
    倒计时3天丨<b class='flag-5'>魏</b><b class='flag-5'>少</b><b class='flag-5'>军</b>教授主旨报告主题、数据出炉

    德米勒如何以联接技术助力智能制造未来

    今年是全球电联解决方案专家德米勒成立175周年,这是历史的积淀,更是其持续进化、不断突破的卓越生命力。近日,CONTROL ENGINEERING China记者专访了德米勒亚太区电气柜产品事业部总监Lars Kosubek先生,就当下热点与
    的头像 发表于 11-10 10:57 1086次阅读

    牌全新蓝山荣获2025声学楼汽车音频技术大奖

    突破性技术创新与卓越用户体验,成功摘得 2025 年声学楼 “汽车音频技术大奖”。这一殊荣不仅是行业对长城汽车在车载音频领域技术突破的高度认可,更标志着牌在智能座舱核心
    的头像 发表于 10-28 10:05 3448次阅读

    上海光机所在周期飞秒激光脉冲相干合束技术研究方面取得进展

    图1 周期飞秒激光远场相干合束系统光路 近日,中国科学院上海光学精密机械研究所高功率激光物理联合实验室研究团队周期飞秒激光相干合束的束载波包络相位(CEP)以及时间抖动测控研究
    的头像 发表于 09-15 08:18 584次阅读
    上海光机所在<b class='flag-5'>少</b>周期飞秒激光脉冲相干合束<b class='flag-5'>技术</b>研究方面取得进展

    育成:以“中国芯”铸就中科亿海微的“小巨人”传奇

    科技(苏州)有限公司(以下简称中科亿海微)总裁育成,却毅然带领团队踏上这片充满挑战的领域,开辟出了一条通往专精特新“小巨人”的不凡之路。情怀为基,锚定芯片赛道育成投
    的头像 发表于 07-18 17:49 1622次阅读
    <b class='flag-5'>魏</b>育成:以“中国芯”铸就中科亿海微的“小巨人”传奇

    数字音频广播的整体架构和相关技术

    数字音频广播(DAB)是继AM和FM之后的第三代广播系统,通过数字信号传输音频内容,具有高音质、抗干扰能力强、频谱利用率高等优点。DAB技术的核心在于其独特的广播架构和调制
    的头像 发表于 07-17 10:58 2587次阅读
    数字音频<b class='flag-5'>广播</b>的整体架构和相关<b class='flag-5'>技术</b>