0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD 7nm Versal系列器件NoC的使用及注意事项

安富利 来源:安富利 2025-09-19 15:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD 7nm Versal系列器件引入了可编程片上网络(NoC, Network on Chip),这是一个硬化的、高带宽、低延迟互连结构,旨在实现可编程逻辑(PL)、处理系统(PS)、AI引擎(AIE)、DDR控制器(DDRMC)、CPM(PCIe/CXL)等模块之间的高效数据交换。

NoC的出现,替代了传统PL内部布线实现复杂总线互连的方式,通过专用硬化通道提升吞吐量、降低延迟、减少逻辑资源占用,并且能实现跨Die(SSIT封装)的高速通信

NoC架构与特性

NoC包含以下主要组件:

NMU(NoC Master Unit):将AXI请求转换为NoC数据包(NPP),支持时钟域转换与速率匹配;

NSU(NoC Slave Unit):接收并解析NoC数据包(NPP),转换为AXI协议;

NPS(NoC Packet Switch):全双工交换机,连接多个NoC节点;

NIDB(NoC Inter-Die Bridge):跨Die的垂直NoC桥接模块。

核心特性

水平(HNoC)与垂直(VNoC)通道:减少PL内布线压力,提高拓展能力;

AXI接口灵活配置:支持32位~512位AXI Mem位宽,以及128位~512位AXI4-Stream;

自动交错访问:跨多个DDR控制器分配请求,提升带宽利用率;

QoS(服务质量):提供基于延迟/带宽的优先级控制;

跨Die通信:多Die设计中提供高效数据通道;

硬化路径固定延迟:相比可编程互连,延迟更可预测,利于实时应用。

7e51031e-946f-11f0-8c8f-92fbcf53809c.png

此文结合Vivado工程,快速熟悉NoC的使用

Vivado中的NoC使用步骤:

新建工程 & BD添加Versal NoC IP

配置AXI\_Slave(NMU)与AXI\_Master(NSU)

连接DDR控制器、CPM、AI Engine等模块

在NoC Compiler中查看拓扑,配置QoS、带宽、路由路径

必要时在XDC中固定NMU/NSU位置以减少路径延迟

分析带宽与延迟,迭代优化

7eb6adb8-946f-11f0-8c8f-92fbcf53809c.png

7f168c74-946f-11f0-8c8f-92fbcf53809c.png

可以看到界面中有AXI_Slave与AXI_Master两种接口,分别对应NMU与NSU。

NoC内部的组件

1、NoC Master Unit (NMU)

NMU的作用是将AXI协议转换为NoC数据包协议(NPP),同时,NMU还支持AXI端口和NoC之间的异步时钟域转换与速率匹配。

下图为Vivado工程中NMU的示例:

7f72f522-946f-11f0-8c8f-92fbcf53809c.png

NMU内部结构:

7fd14f1e-946f-11f0-8c8f-92fbcf53809c.png

当AXI请求进入NMU时钟域时,将执行数据分组,读写事务被分解为更小的传输(此过程称为chopping)。

NPP写入的最大大小为256字节。超过256字节的AXI写入可以跨越多个NPP写入。De-Packetizing&Packetizing会将粒度大于或等于256字节的事务切分为256字节的传输。例如,一个从0x0开始的1K传输事务将分为4 packet进行传输:0-255、256-511、512-767、768-1023。

Re-tagging模块在读取时重新标记以允许无序传输并防止互连阻塞。

在对外的AXI接口上支持配置32位~512位,在AXI4-Stream上支持从128位~512位的可配置数据宽度接口。AXI数据宽度通过参数传播从连接的IP,无需手动指定位宽。

2、NoC Slave Unit (NSU)

NSU的主要功能是接收和响应来自NoC的数据包,这些数据包寻址到NSU数据包接口,旨在发送到对应的AXI端口。

802c7eb6-946f-11f0-8c8f-92fbcf53809c.png

3、NoC Packet Switch (NPS)

连接NoC块以形成完整NoC网络交换。每个NPS都是全双工4x4 Switch,通过Switch至少有两个延迟周期。

80908fe6-946f-11f0-8c8f-92fbcf53809c.png

NSU512(PL) NSU512(PL)

4、NoC Inter-Die Bridge (NIDB)

在多个SSIT芯片之间桥接垂直NoC(VNoC)。

Quality of Service(QoS)

Traffic Class与Read and Write Bandwidth

80f3327c-946f-11f0-8c8f-92fbcf53809c.png

1、流量类别(Traffic Class)

定义了连接上的流量在NoC编译器和硬件中的优先级。流量类在NMU上设置,适用于从该NMU开始的所有路径。Traffic Class支持如下3种模式:

Low Latency:尽量减少结构延迟,DDR仲裁中优先级最高;

Isochronous:保证最大延迟;DDR队列中设定超时提前处理;

Best Effort:最低优先级,适合非关键流量。

2、带宽需求(Bandwidth Requirement)

单独设置读/写带宽(单位MB/s或Gb/s);

Vivado NoC Compiler会基于此进行资源分配与仲裁优化。

性能优化建议

关键流量优先保障:通过QoS将低延迟或同步流量优先级调高;

减少跨交换机跳数:布局时尽量缩短NMU→NSU的路径;

合理位宽分配:带宽与功耗需权衡,避免过度配置浪费资源;

多Die优化:跨Die数据尽量走专用VNoC通道,减少延迟;

路径可视化:在NoC Compiler拓扑图中检查关键路径是否经过不必要的节点。

在Vivado BD的NoC界面,可以看到DDRNMUNSUNPSQoS等。

8152933e-946f-11f0-8c8f-92fbcf53809c.png

81ba9e2a-946f-11f0-8c8f-92fbcf53809c.png

82156030-946f-11f0-8c8f-92fbcf53809c.png

点击如下QoS选择卡中的条目,可以看到此路径下的NoC拓扑。

82748556-946f-11f0-8c8f-92fbcf53809c.png

关于安富利

安富利是全球领先的技术分销商和解决方案提供商,在过去一个多世纪里一直秉持初心,致力于满足客户不断变化的需求。通过遍布全球的专业化和区域化业务覆盖,安富利可在产品生命周期的每个阶段为客户和供应商提供支持。安富利能够帮助各种类型的公司适应不断变化的市场环境,在产品开发过程中加快设计和供应速度。安富利在整个技术价值链中处于中心位置,这种独特的地位和视角让其成为了值得信赖的合作伙伴,能够帮助客户解决复杂的设计和供应链难题,从而更快地实现营收。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5652

    浏览量

    139084
  • 片上网络
    +关注

    关注

    0

    文章

    34

    浏览量

    12086
  • NoC
    NoC
    +关注

    关注

    0

    文章

    43

    浏览量

    12103
  • Vivado
    +关注

    关注

    19

    文章

    848

    浏览量

    70520

原文标题:AMD技术干货|NoC的使用及注意事项

文章出处:【微信号:AvnetAsia,微信公众号:安富利】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于AMD Versal器件实现PCIe5 DMA功能

    VersalAMD 7nm的SoC高端器件,不仅拥有比16nm性能更强的逻辑性能,并且其PS系统中的CPM PCIe也较上一代MPSoC
    的头像 发表于 06-19 09:44 1497次阅读
    基于<b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b><b class='flag-5'>器件</b>实现PCIe5 DMA功能

    AMD 7nm芯片的封测厂商通富微电介绍

    国内的通富微电成为AMD 7nm芯片的封测厂商之一
    发表于 12-30 07:48

    随着AMD 7nm制程芯片的加速落地,AMD将爆发更强悍的性能

    2018年6月6日,Computex 2018期间,AMD正式展示了代表未来的产品——7nm制程采用Zen 2架构的EPYC(霄龙)服务器处理器,以及7nm制程、32GB HBM2显存的Radeon Vega GPU,进一步加快
    发表于 06-14 16:52 1114次阅读

    AMD7nm明年有望出现

    AMD现阶段的12nm工艺技术处理器晶片虽然面积没有减少,但是进步表现在主频的提升上。官方表示,至于7nm工艺技术,将和英特尔10nm工艺相似,但是明显
    发表于 07-06 10:33 980次阅读

    AMD公开VEGA GPU架构使用7nm工艺

    在日前举行的Computex 2018发布会上,AMD有些出人意料地进行了高规格的产品发布,公开的产品包括下一代使用7nm工艺的VEGA GPU,以及使用7nm的Zen 2处理器。目前,7nm
    的头像 发表于 06-29 16:17 4822次阅读

    AMD 7nm处理器和Intel 7nm处理器有什么区别?

    在说明AMD 7nm处理器和Intel 7nm处理器的分别之前,我们必须了解一点就是,由于10nm的难产,Intel在7nm工艺上远远落后于
    发表于 07-23 10:04 2w次阅读

    Q3季度AMD芯片均价大涨40% 7nm正在给AMD带来丰厚回报

    AMD今年抢先升级了7nm工艺,包括GPU及CPU在内都比对手领先,尽管上新工艺的代价不低,但AMD这次赌对了,7nm正在给AMD带来丰厚回
    发表于 11-01 11:44 712次阅读

    AMD或使用三星7nm制程来制造RX 5500系列显卡

    据国外媒体报道,消息称,芯片制造商AMD已经使用三星的7nm制程,来制造其Radeon RX 5500系列显卡。
    的头像 发表于 12-18 17:09 3096次阅读

    AMD Radeon Pro W5700系列专业卡开售,核心基于7nm Navi 10

    AMD7nm Navi家族显卡已经有RX 5700、RX 5500系列的消费级显卡了,11月中旬AMD又推出了Radeon Pro W5700系列
    的头像 发表于 12-25 16:17 3676次阅读

    超越苹果和海思,AMD在台积电7nm产能占比第一

    2020年除了7nm显卡之外,AMD的桌面锐龙、HEDT发烧处理器、服务器霄龙及笔记本锐龙APU四大产品线也会继续升级,3款会上7nm+EUV工艺及Zen3架构。AMD不断加码
    的头像 发表于 01-03 08:59 3893次阅读

    AMD 7nm U/H系列处理器支持面容和指纹登陆

      AMD官网现已公布其7nm APU,页面显示新款的U系列和H系列处理器将支持Windows Hello指纹/刷脸登录,内存支持也达到了LPDDR4-4266。
    的头像 发表于 01-07 14:16 3447次阅读

    AMD推出锐龙4000系列APU处理器 7nm锐龙APU尤其重要

    在CES 2020展会上,AMD正式推出了7nm工艺的锐龙4000系列APU处理器,还有RX 5600 XT显卡及锐龙Threadripper 3990X处理器。这些产品中,7nm锐龙
    发表于 01-09 14:48 7542次阅读

    AMD加速甩掉14nm工艺,IO核心有望使用台积电7nm工艺

    去年AMD推出了7nm Zen2架构的锐龙、霄龙处理器,这是首款7nm工艺的x86处理器。不过严格来说它是7nm+14nm混合,现在AMD
    的头像 发表于 09-24 10:12 2350次阅读

    消息称AMD明年成7nm最大客户:暴增80%

    AMD今年推出了7nm工艺的锐龙5000、RDNA2架构的RX 6000系列显卡,不过上市一两个月来还是在缺货,原因是7nm产能紧张,这个问题可能要到明年才能缓解了。
    的头像 发表于 12-21 11:06 2015次阅读

    AMD Versal自适应SoC器件Advanced Flow概览(下)

    AMD Vivado Design Suite 2024.2 版本中,Advanced Flow 自动为所有 AMD Versal 自适应 SoC 器件启用。请
    的头像 发表于 01-23 09:33 1386次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b>自适应SoC<b class='flag-5'>器件</b>Advanced Flow概览(下)