0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于ZU+的外挂8颗DDR4的设计案例分析

电子设计 来源:赛灵思中文社区 作者:赛灵思中文社区 2020-12-21 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本篇主要针对Zynq UltraScale + MPSoC的DDR接口,从硬件设计的角度进行详细介绍,最后展示一下小编之前自己设计的基于ZU+的外挂8颗DDR4的设计。

目前比较常用的DDR是DDR4和DDR3,其他系列相对使用较少一些,本文主要以DDR4进行介绍。

1、选型

根据ZU+系列芯片的数据手册、TRM、pg150等文档,DDR可以挂载在PS侧,也可以挂载在PL侧,也可同时挂载在PS侧和PL侧。

PL和PS均支持64位的DDR4(不带ECC功能),PL部分如果要支持64位的DDR4,则至少需要提供三个bank的HP接口,只能选择SFVC784或者更高的封装。需要特别说明的是,使用内存颗粒和使用内存条的容量差异较大,需要根据实际需求进行选择。

ZU+的DDR4接口如下:

o4YBAF9uGkGAa1gkAAz-mjznpmI860.png

PS侧DDR接口框图

o4YBAF9uGkOAVvpxAAHrhcNxERc710.png

PL侧DDR接口框图

针对DDR3,其特性如下:

支持DDR3 (1.5V) and DDR3L (1.35V)

容量限制:Support densities up to 8 Gb for components, 32 GB for RDIMMs, 16 GB for SODIMMs, and 16 GB for UDIMMs. Other densities for memory device support is available through custom part selection.

针对DDR4,其特性如下:

容量限制:Support densities up to 32 Gb for components, 64 GB for LRDIMMs, 128 GB for RDIMMs, 16 GB for SODIMMs, and 16 GB for UDIMMs. Other densities for memory device support is available through custom part selection.

DDR接口粗略的介绍可以参见之前的文章《Zynq UltraScale+系列之“外围接口概述”》,PS侧的DDR控制器的详细特性可参看《UG1085》的第17章,PL侧的的相关特性可参考《PG150》、《WP454》等资料,此处不再赘述。

2、Performance

DDR总线的效率在不同的使用模式下差异很大,在实际评估速率时一定要搞清楚使用情况。

针对几种常用的操作模式,《PG150》给出了具体的效率,详见下表:

pIYBAF9uGkSAZHOGAAC1UE9LAdY206.png

几种常见的操作模式如下:

Sequential Read

Simple address increment pattern

100% reads

Sequential Write

Simple address increment pattern

100% writes (except for periodic reads generated by the controller for VT tracking)

Burst Read/Write Mix

Repeating pattern of 64 sequential reads and 64 sequential writes

50/50 read/write mix

Short Burst Read/Write Mix

Repeating pattern of four sequential reads and four sequential writes

Full DRAM page accessed in bursts of four before changing the row address for high page hit rate

50/50 read/write mix

Random Address Read/Write Mix

Repeating pattern of two random reads and two random writes

Fully random address for a low page hit rate

50/50 read/write mix

3、原理图设计

PS侧的原理图设计基本没有任何问题,按照对应功能引脚连接即可,PL侧的接口需要特别注意。

对于单个Memory接口,尽量集中使用几个HP bank。如果使用三个bank,两个bank用作数据接口,一个bank用作地址、控制、命令信号线接口,地址、控制、命令信号尽量使用同一个bank,不要跨bank使用;如果使用两个bank,尽量保证数据相关引脚在一个bank,地址和控制信号在另一个bank。

地址、控制、命令信号不能和data共用byte group,只能使用data byte groups以外的byte groups。

CK差分时钟对必须使用差分对,必须连接在控制byte group上,尽量按照Vivado软件对时钟引脚的约束来连接。如果有多个CK对,必须来自于同一个byte lane。

除了DQS和CK之外,其他信号都可以在byte group内随意交换。

pIYBAF9uGkqAfUfuAAfB0A1-Pw4036.png

每一byte的data可以在组内随意交换

前期原理图设计阶段最好在vivado中进行PL侧管脚预分配,别等到PCB出来后才开始在vivado中验证,如果关键信号管脚定义有问题,不能交换,则无法弥补。

针对ZU+系列MPSoC,DDR4接口的原理图处理如下:

o4YBAF9uGk6AFpzaAAQCJnD0veE505.png

4、PCB Guidelines for DDR4 SDRAM (PL and PS)

DDR总线的布局布线需要遵循一些通用的规则,数据线只支持点到点连接,其他信号根据颗粒数量的不同可以有多种拓扑。

ZU+ DDR4 SDRAM支持两种拓扑类型:fly-by和clamshell。Clamshell拓扑在板子空间比较紧张时有一定的优势。在MIG中(PL侧)是一种可选的拓扑,在PS侧不支持clamshell拓扑。

如果使用5片x16的颗粒组成80位宽的接口时,5片DDR的布局采用fly-by topology,如果用9片x8的颗粒,则采用clamshell topology比较节约空间。

pIYBAF9uGlCAAzxcAAGVjEcOGdQ387.png

pIYBAF9uGlKABYlCAAGOUEHemsc147.png

pIYBAF9uGlSAVSpbAACJovQr6-4174.png

4.1.1、Fly-by结构布局

o4YBAF9uGlWAcnCSAAB4g2U685k671.png

pIYBAF9uGlaAIwEPAACWA5D_Q0o264.png

pIYBAF9uGlmAVezqAAKXA1PSnuY196.png

o4YBAF9uGluAOOA_AAEVh1ZD5rw454.png

4.1.2、Clamshell结构布局

o4YBAF9uGl2AR6RqAAIYouKvaJw631.png

pIYBAF9uGl6AdK3GAACJovQr6-4975.png

pIYBAF9uGmCACkQBAADEfQEatnM853.png

o4YBAF9uGmKAAsg-AADtaZuix1U434.png

o4YBAF9uGmSAW_6xAAIVbPWhn7o068.png

pIYBAF9uGmaASZsqAAHeszVS-b0205.png

4.1.3、Point-to-Point数据信号

pIYBAF9uGmeAUj3eAABcUiZX4fk853.png

o4YBAF9uGmuALI_2AAItwE1713Y496.png

由于官方推荐的主线路阻抗较小(单端36/39Ω,差分76Ω),线宽比较宽,但扇出部分阻抗又比较大(单端50Ω,差分86Ω),会导致阻抗突变,因此实际使用中可以通过调整叠层来优化线宽,在满足阻抗要求的同时减小阻抗突变。

4.1.4、Layout Guidelines

以下为DDR4的约束规则,表格中的参数均为最短信号线和最长信号线之间的tolerance参数,数据group一般都是以DQS为TARGET,DQ与DQS进行比较约束。地址、控制、命令group一般都是以CLK为TARGET,ACC(Address、Command、Control)与CLK进行比较约束。

o4YBAF9uGmyATMQxAADsjMFZeyA083.png

pIYBAF9uGm6AMCQyAACl7XzAYdw179.png

o4YBAF9uGnCAZmcUAADlmiYRHO8157.png

pIYBAF9uGnKAHLmHAACbgZBIixI560.png

针对上图解释为:例如,最快的ACC信号线传输时间是800ps,最慢的ACC信号线传输时间是840ps,时钟信号线的传输时间应该为862ps±8ps,比ACC总线的中间传输时间(820ps)慢42ps.

o4YBAF9uGnOAPsUBAAB9rng-fWM264.png

o4YBAF9uGnWAQVTUAACfYrkxt24634.png

CLK和DQS之间的约束比较宽松,最小的差异可以为-879,最大差异可以为+10600,主要是为了保证读写平衡功能从整个菊花链的第一片到最后一片颗粒都正常。

DDR控制器可以调整DQS信号线的内部延迟,由于CK信号线链路连接每一片DDR颗粒,导致CK容性负载更重,所以需要能够调整DQS信号线的内部延迟,以满足和CK之间的约束。

规范规定CK信号线和DQS信号线从FPGA到链路中的第一片DDR颗粒的偏差不小于-149ps,到链路中最远端的DDR颗粒的偏差不大于1796ps。只要链链路中第一片DDR颗粒和最后一片DDR颗粒都满足此条件,整个链路上所有的DDR颗粒的读写平衡功能都将正常。

例如,如果从FPGA到第一片DDR颗粒的DQS延迟为200ps,则从FPGA到第一片DDR颗粒的CK延迟应至少为51ps(200ps-149ps)。如果从FPGA到最后一片DDR颗粒的DQS延迟为700ps,则从FPGA到最后一片DDR颗粒的CK延迟应该小于2496ps(700ps+1796ps)。

下面是一些基本的规则,可以参考遵守:

使用内存条时,CK信号和DQS信号之间的余量会更小一些,因为约束的是FPGA到DIMM插槽处,而颗粒的走线是由DIMM决定的,因此余量预留小一些。

同组的DQ、DQS、DM走线必须在同一层。

DIMM数据线走线最好选择靠近接插件的层,尤其是靠DIMM中间位置的数据组。

采用菊花链结构布线时,ACC信号线可以布在不同的层,但层数越少越好。不要将一个信号切换好几层,主要走线尽量一层走完,这样可以减小串扰,信号换层时,切换过孔附近50mil范围内需要放置一个接地过孔。

FPGA和DDR器件驱动端的阻抗为40Ω,DCI和ODT也是40Ω。因此VTT端接电阻都选为39.2Ω。

当使用内部VREF时,PL侧HP bank上的VREF引脚可以悬空,但不能用于普通IO。

如果系统时钟连接到了DDR的HP bank,则LVDS时钟信号需要外部端接至合适的电压,因为该bank上有不同的逻辑电平 (HSTL, SSTL, or POD)。

对于菊花链布局,人字形扇出(chevron-style routing)可以形成stitching vias;对于比较紧凑的布局,可以通过环抱式扇出形成ground stitch vias。

在器件内部或者周围尽量多放置接地过孔,这样可以更好的为信号提供返回路径,尤其是在边角的位置。

对于ACC信号线的端接电阻布局,应该每四个端接电阻中间穿插布局一个0.1uF的VTT去耦电容,这样可以减小端接VTT的噪声。为了便于布局,最好在原理图中就按每四个电阻放置一个去耦电容。

对于DIMM,去耦电容放置得离DIMM越近越好,这样除了能提供接地过孔外,也能给电源提供低阻抗回路。

pIYBAF9uGnaAE6YiAACc6ZKmvF8118.png

o4YBAF9uGn2AFGL2AAYFlJhNnyw456.png

pIYBAF9uGoKAKSoCAASbRoDHZ5Y169.png

o4YBAF9uGoeAAZC0AASbDyCAA2I020.png

pIYBAF9uGoqANqqPAALt2wgh2Bw692.png

以上就是针对ZU+系列MPSoC的DDR接口的详细介绍,PCB设计相关可参考《UG583:UltraScale Architecture PCB Design User Guide》、官方开发板ZCU104、ZCU102、ZCU106等。

下面介绍一下小编自己设计的基于ZU+(XCZU3CG-SFVC784)的外挂8颗DDR4的设计,采用十层板,板厚1.6mm,最小线宽4mil。板子尺寸120*150mm,单12V电源输入,支持串口、I2CUSB、GbE、TF卡、CAN、PCIe等常用接口,预留PS侧和PL侧IO接口。

硬件框图如下图所示:

o4YBAF9uGo2ALNYHAAH3bOpq27U755.png

叠层设计如下图所示:

pIYBAF9uGpWAU06dAAXMsWaedgs753.png

整板DDR4部分布局如下图所示:

Allegro中的约束规则如下图所示:

pIYBAF9uGqmAM3DOAArps7ji6H8942.png

ACC信号线的约束规则如下图所示:

o4YBAF9uGrGAPSRiAAc0MtiFmCo015.png

DATA信号线的约束规则如下图所示:

o4YBAF9uGrWATsqaAAMNngffiko954.png

整板布线完成后的情况如下图所示:

编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • pcb
    pcb
    +关注

    关注

    4417

    文章

    23962

    浏览量

    426099
  • DDR
    DDR
    +关注

    关注

    11

    文章

    761

    浏览量

    69543
  • DDR4
    +关注

    关注

    12

    文章

    351

    浏览量

    43338
  • ACC
    ACC
    +关注

    关注

    1

    文章

    61

    浏览量

    23650
  • Zynq
    +关注

    关注

    10

    文章

    633

    浏览量

    49570
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DDR4价格疯涨!现货市场狂飙!

    下,渠道抢货助推价格上涨。未来随着大厂的减产,其他内存厂商承接市场需求或将持续影响DDR4的供需走势。   极速涨价   CFM闪存市场数据显示,近期渠道资源从高端到底部低端料号价格自上而下全线走高,渠道存储厂商仍坚定强势拉涨DDR4 UDIMM报价,部分
    的头像 发表于 06-19 00:54 1.1w次阅读
    <b class='flag-5'>DDR4</b>价格疯涨!现货市场狂飙!

    X3D续命,棘蛇再推高端新品,DDR4时代真的结束了吗?

    过去几年,随着DDR5内存逐渐普及,新平台也相继退出对前代内存的支持,“DDR4时代已经结束”成为了主流声音。但站在2026年这个节点,我们看到的却是另一番景象:DDR4不仅没有谢幕,反而在市场的倒
    的头像 发表于 04-17 08:58 206次阅读

    IDT 4MX0121V:DDR3/DDR4 NVDIMM的理想开关/多路复用器

    ,我们就来深入了解一款专为DDR3/DDR4 NVDIMM设计的12位总线开关/多路复用器——IDT 4MX0121V。 文件下载: 4MX0121VA13AVG8.pdf 产品特性与
    的头像 发表于 04-12 09:15 413次阅读

    使用DDR4时钟架构

    使用DDR4这个IP核时,时钟如何架构十分关键,DDR4 IP对时钟有特殊的要求,可以是差分时钟也可以是No buffer的单端时钟,在IP核的配置界面可以配置。如果选择的是差分时钟,可以直接与硬件
    的头像 发表于 04-10 13:59 192次阅读
    使用<b class='flag-5'>DDR4</b>时钟架构

    64GB 288 - Pin DDR4 RDIMM详细介绍

    (x72, ECC, DR) 288 - Pin DDR4 RDIMM。 文件下载: MTA36ASF8G72PZ-3G2E1.pdf 一、产品概述 这款64GB的288 - Pin DDR4 RDIMM
    的头像 发表于 04-08 15:30 199次阅读

    32GB (x72, ECC, DR) 288 - Pin DDR4 RDIMM:技术剖析与设计考量

    32GB (x72, ECC, DR) 288 - Pin DDR4 RDIMM:技术剖析与设计考量 在当今数字化时代,内存技术的发展日新月异,DDR4内存模块凭借其高速、高效的特性,成为众多
    的头像 发表于 04-08 15:30 374次阅读

    rk3562ddr4设计资料图

    这是瑞芯微rk3562主控DDR4设计参考图。
    发表于 03-25 17:40 0次下载

    利基型DRAM供需错配,DDR4 8Gb接受度高,加速转进DDR5/LPDDR5

    (作者:黄晶晶)日前,华邦电子DDR4 8Gb 产品已自今年第一季会开始出货,首波应用以电视、网通与嵌入式系统为主。在供给偏紧环境下,客户对新规格接受度高,产品线结构已较过去明显改善,后续出货比重将
    的头像 发表于 01-27 16:23 5883次阅读
    利基型DRAM供需错配,<b class='flag-5'>DDR4</b> <b class='flag-5'>8</b>Gb接受度高,加速转进<b class='flag-5'>DDR</b>5/LPDDR5

    华邦电子推出先进 16nm 制程 8Gb DDR4 DRAM 专为工业与嵌入式应用而生

    2025 年 12 月 3日,中国苏州 — 全球半导体存储解决方案领导厂商华邦电子今日宣布推出全新 8Gb DDR4 DRAM,该产品采用华邦自有先进 16nm 制程技术,提供更高速度、更低
    的头像 发表于 12-03 16:44 1298次阅读
    华邦电子推出先进 16nm 制程 <b class='flag-5'>8</b>Gb <b class='flag-5'>DDR4</b> DRAM 专为工业与嵌入式应用而生

    N34C04 EEPROM:DDR4 DIMM的理想SPD解决方案

    在电子设计领域,对于DDR4 DIMM的设计,EEPROM的选择至关重要。N34C04作为一款专门为DDR4 DIMM设计的EEPROM Serial 4 - Kb器件,实现了JEDEC
    的头像 发表于 11-27 14:42 805次阅读
    N34C04 EEPROM:<b class='flag-5'>DDR4</b> DIMM的理想SPD解决方案

    三星正式启动DDR4模组停产倒计时,PC厂商加速转向DDR5,供应链掀抢货潮

    涉及多款 8GB、16GB DDR4 SODIMM 及 UDIMM 模组,标志着 DDR4 内存时代进入收尾阶段。
    的头像 发表于 10-14 17:11 1733次阅读

    ‌TPS65295 DDR4内存电源解决方案技术文档总结

    TPS65295器件以最低的总成本和最小的空间为 DDR4 内存系统提供完整的电源解决方案。它符合 DDR4 上电和断电序列要求的 JEDEC 标准。该TPS65295集成了两个同步降压转换器
    的头像 发表于 09-09 14:16 2138次阅读
    ‌TPS65295 <b class='flag-5'>DDR4</b>内存电源解决方案技术文档总结

    涨价!部分DDR4DDR5价差已达一倍!

    (2GX8)内存在6月2日的报价为5.171美元,当时比DDR5低约8%。然而,最新报价显示DDR4已上涨至8.633美元,不到一个月时间内涨幅高达67%,且已经超过
    的头像 发表于 06-27 00:27 5444次阅读

    看点:三星DDR4内存涨价20% 华为与优必选全面合作具身智能

    给大家带来一些业界资讯: 三星DDR4内存涨价20%  存储器价格跌势结束,在2025年一季度和第二季度,价格开始企稳反弹。 据TrendForce报道称,三星公司DDR4内存开始涨价,在本月
    的头像 发表于 05-13 15:20 1544次阅读

    DDR4涨价20%,DDR5上调5%!

    最新消息,三星电子本月初与主要客户就提高DRAM芯片售价达成一致。DDR4 DRAM价格平均上涨两位数百分比;DDR5价格上涨个位数百分比。据称 DDR4 上调 20%,DDR5 上调
    的头像 发表于 05-13 01:09 7793次阅读