0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

芯耀辉DDR PHY训练技术简介

数字芯片实验室 来源: 数字芯片实验室 2024-01-05 10:27 次阅读

DDR接口速率越来越高,每一代产品都在挑战工艺的极限,对DDR PHY的训练要求也越来越严格。本文从新锐IP企业芯耀辉的角度,谈谈DDR PHY训练所面临的挑战,介绍芯耀辉DDR PHY训练的主要过程和优势,解释了芯耀辉如何解决DDR PHY训练中的问题。

引言

DDR接口速率越来越高,每一代产品都在挑战工艺的极限,对DDR PHY的训练要求也越来越严格。本文从新锐IP企业芯耀辉的角度,谈谈DDR PHY训练所面临的挑战,介绍芯耀辉DDR PHY训练的主要过程和优势,解释了芯耀辉如何解决DDR PHY训练中的问题。

DDRPHY训练简介

高可靠性是系统级芯片SoC重要的质量和性能要求之一。SoC的复杂在于各个IP模块都对其产生至关重要的影响。从芯耀辉长期服务客户的经验来看,在客户的SoC设计中,访问DDR SDRAM是常见的需求,所以DDR PHY则成为了一个非常关键的IP,其能否稳定可靠的工作决定了整个SoC芯片的质量和可靠性。

制定DDR协议的固态技术协会(JEDEC)标准组织并没有在规范中要求动态随机存取存储器(DRAM)需要具备调整输入输出信号延时的能力,于是通常DDR PHY就承担起了输入和输出两个方向的延时调整工作,这个调整的过程称为训练(training)。训练是为了使DDR PHY输出信号能符合固态技术协会标准的要求,DDR PHY通过调节发送端的延迟线(delay line),让DRAM颗粒能在接收端顺利地采样到控制信号和数据信号;相对应的,在DDR PHY端,通过调整内部接收端的延迟线,让DDR PHY能顺利地采样到DRAM颗粒的输出信号。从而在读写两个方向,DDR接口都能稳定可靠地工作。

2f1da904-ab10-11ee-8b88-92fbcf53809c.png

图1:DDR PHY承担了输入和输出两个方向的延时调整工作

然而,随着DDR工作频率提高,DDR PHY训练的准确性和精度要求也随之提高。训练的准确性和精度决定了DDR系统能否稳定可靠地工作在较高的频率。

DDRPHY训练所面临的挑战

DDR训练的种类繁多,每个训练的结果都不能出错。同时固态技术协会定义的训练序列都比较单一,如果只使用这些默认序列的话,训练结果在实际工作中并不是一个最优值。

目前绝大多数DDR PHY都采用硬件训练的方式,如果硬件算法有问题,会导致训练出错,DDR无法正常稳定地工作,导致整个SoC的失败。同时,硬件训练模式很难支持复杂的训练序列和训练算法,从而无法得到训练结果的最优解。

芯耀辉的DDR PHY采用软硬件结合的固件(firmware)训练方式跳出了上述DDR PHY训练模式的固定思维。

芯耀辉DDRPHY在训练上的优势

解决写入均衡(writeleveling)的难题

写入均衡是为了计算出flyby结构下命令通路和数据通路的走线延迟的差值,在DDR PHY中把这个差值补偿到数据通路上,从而最终让数据通路和命令通路的延迟达到一致。

2f34fc3a-ab10-11ee-8b88-92fbcf53809c.png

图2:DDR flyby拓扑结构示意图

在实际的应用中,命令(command)路径上的延时会超过数据(DQ)路径的延时。假设路径差值=命令路径延时–数据路径延时,一般路径差值在0~5个时钟周期之间。可以把路径差值分为整数部分和小数部分(单位是0.5个时钟周期)。

2f393d72-ab10-11ee-8b88-92fbcf53809c.png

图3:命令路径延时、数据路径延时和路径差值

根据固态技术协会标准(如JESD79-4C)的写入均衡的要求,DRAM在写入均衡模式下会用DDR PHY发送过来的DQS沿去采样CK,并把采样的值通过DQ返回给DDR PHY。

2f45907c-ab10-11ee-8b88-92fbcf53809c.png

图4:写入均衡模式下调整DQS时延的示意图

通过该训练,DDR PHY可以计算出命令与数据路径延时差值的小数部分,却没有办法训练出命令与数据路径延时差值的整数部分(把DQS多延迟一个时钟周期或者少延迟一个时钟周期,用DQS采样CK的采样值是相同的)。

为了解决这个问题,通常会根据版图设计估算出大概的路径差值,从而自行得到路径差值的整数部分,直接配置到DDR PHY的寄存器中。这种做法在频率比较低、量产一致性比较好的时候问题不大。但在大规模量产的时候,如果平台之间的不一致性超过一个时钟周期(LPDDR4最高频下周期为468ps)的话,上述直接配置整数部分的方法就没法进行工作了,必然会导致部分芯片无法正常工作。

芯耀辉采用固件的训练方式,通过DDR写操作时特殊调节方法,能够帮助客户计算出路径差值整数加小数部分,无需客户根据版图设计估算路径差值范围。

2f4cdb0c-ab10-11ee-8b88-92fbcf53809c.png

图5:路径差值整数部分训练和小数部分训练

过滤训练时DQS的高阻态

读操作时,DQS信号在前导(preamble)前是高阻态,同时DQS信号的前导部分也不能达到最稳定的状态,所以需要训练出读DQS的gate信号来过滤掉前面的高阻态和前导,恰好得到整个读突发(Read Burst)操作的有效DQS,这就是读DQS gate训练。

芯耀辉采用特定的方法,在训练的时候,排除不稳定DQS的干扰,用读DQS的gate信号得到读突发数据对应的第一个DQS的上升沿位置,从而得到gate的位置。

2f50927e-ab10-11ee-8b88-92fbcf53809c.png

图6:读DQS gate训练

延迟DQS提高读DQ训练的准确性

一般在DDR PHY中没有这个训练,因为该训练不是固态技术协会标准要求的,可是在实际应用中,这个训练却有着比较重要的意义。

2f5e9b62-ab10-11ee-8b88-92fbcf53809c.png

图7:LPDDR4突发读(来源固态技术协会标准JESD209-4B)

读DQS和读DQ之间的偏差为tDQSQ,这个值的范围是0~0.18UI(在高频下约为0~42ps)。读训练的时候,采用延迟DQS的方法,找到DQ的左右窗口,最后把DQS放在DQ窗口的中心点。由于DDR PHY内部的DQS-DQ延迟偏差、封装的pad延迟偏差、以及PCB走线偏差,虽然DRAM端输出的tDQSQ为正数(DQ的延迟比DQS大),但在DDR PHY内部看到的tDQSQ却可能为负数(DDR PHY内部DQS的延迟比DQ大),如图8上半部分所示。

在这种情况下,即使DQS的延迟为0,DQS也落在DQ的窗口内,PHY内部会通过从0延迟开始增加DQS的延迟来搜索DQ的左右窗口,这样必然导致最终搜索到的DQ的窗口比实际的窗口要小,读训练后的DQS的采样点不在DQ的正中间,而在偏右的位置,最终读余量(margin)变小。

芯耀辉通过特定的方法,能让每个DQ的窗口都在DQS右边,这样做读训练的时候,可以搜索到DQ的完整窗口,提高了读训练的准确性,提升DDR的读性能。

2f7600a4-ab10-11ee-8b88-92fbcf53809c.png

图8:Read DQ skew training

用固件的训练方法获取读数据眼图(Readdataeye)的优化值

读数据眼图训练通过延迟读DQS的方法,把读DQS放在DQ窗口的中间。目前最大的问题是固态技术协会标准对读数据眼图的读序列定义的比较简单,比如对于DDR4,定义的序列是01010101的固定序列。因为高速信号的符号间干扰以及信号反射,在不同的读序列的情况下DQ窗口是有差异的,所以采用简单固定的序列并不能很好地覆盖实际的使用场景,导致训练结果在实际工作时并不是一个优化值。

芯耀辉采用固件的训练方法,可以设置不同的范式(pattern),如PRBS范式、特殊设计的扫频范式等。显然此类范式能更好地反映数据通道的特性,因为它包含了高频、中频、低频信息,以及长0和长1带来的码间串扰等问题,可以获得较优的训练结果,从而得到一个能覆盖实际工作场景的可靠值。

二维训练模式下优化的参考电压(Vref)电压和地址线(CA)延迟

LPDDR3中引入了地址线训练,DRAM把采样到的地址信号通过数据通路反馈给DDR PHY,DDR PHY可以通过这个反馈去调节地址线的延迟。在LPDDR4中,还加入了地址线参考电压的训练,所以不仅需要调节地址线的延迟,还需要找到一个最优的参考电压值。传统使用硬件训练的方式在面对这种两个维度的训练时就会显得捉襟见肘,同时硬件算法也没法做得太复杂。

芯耀辉采用固件的二维训练模式,可以绘制出完整的以地址线延迟为横坐标和以参考电压为纵坐标的二维图像,从而得到较优的参考电压和对应的地址线延迟。

二维训练模式下优化的DQ参考电压和DQ延迟

DDR4的固态技术协会标准中引入了DQ参考电压,可是对于如何训练并没有给出说明和支持,所以大多数DDR PHY并不支持DDR4的DQ参考电压训练,只能配置一个固定参考电压值。

LPDDR4的固态技术协会标准增加了写DQS-DQ训练(调整写DQ相对于写DQS的相位)和DQ参考电压训练协议上的支持。

芯耀辉采用固件的方式,不仅支持了DDR4的DQ参考电压训练,同时对于LPDDR4的写DQS-DQ和DQ参考电压训练,也采用了固件的二维训练模式,绘制出完整的以DQ延迟为横坐标和以DQ参考电压为纵坐标的二维图像,在整个二维图像中找到较优的DQ参考电压和对应的DQ延迟。

总结

随着工艺节点的提升和DDR颗粒技术的演进,DDR的工作频率越来越高,DDR颗粒的训练要求也越来越高。同时对于DDR PHY来说,内部的模拟电路(FFE,DFE等)随着频率的提升也需要做各种高精度的训练。芯耀辉采用软硬结合的智能训练方法不仅可以支持DDR颗粒的各种必要的复杂训练,也同时可以支持DDR PHY内部模拟电路的各种训练。通过不断优化训练算法,持续挑战每一代DDR产品的速率极限。

Reference:软硬结合的智能DDR PHY训练技术-电子工程专辑 (eet-china.com)

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • soc
    soc
    +关注

    关注

    38

    文章

    3745

    浏览量

    215678
  • PHY
    PHY
    +关注

    关注

    2

    文章

    264

    浏览量

    51005
  • DDR接口
    +关注

    关注

    0

    文章

    5

    浏览量

    7501
  • 芯耀辉
    +关注

    关注

    2

    文章

    36

    浏览量

    9808

原文标题:软硬结合的智能DDR PHY训练技术

文章出处:【微信号:数字芯片实验室,微信公众号:数字芯片实验室】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    IP新锐芯耀辉多点破局DDR PHY技术瓶颈

    DDR PHY是DRAM和内存控制器通信的桥梁,它负责把内存控制器发过来的数据转换成符合DDR协议的信号,并发送到DRAM。
    发表于 04-20 11:37 4592次阅读
    IP新锐芯耀辉多点破局<b class='flag-5'>DDR</b> <b class='flag-5'>PHY</b><b class='flag-5'>技术</b>瓶颈

    altera 添加ddr2 出现如下错误,什么原因 ?

    2:DDR2U|DDR2_controller_phy:DDR2_controller_phy_inst|mem_dq[15]", cannot be assigned more than one
    发表于 03-18 19:55

    电子技术实践与训练

    本帖最后由 gk320830 于 2015-3-5 11:42 编辑 电子技术实践与训练
    发表于 05-25 17:49

    高薪聘请-Serdes PCS/DDR3/4 PHY

    blocks.2. Design DDR/DDR2/DDR3 memory PHY both for receiver and transmitter.3. Interact wit
    发表于 11-13 14:46

    ADI模拟技术训练营:放大器初步

    转发ADI模拟技术训练营——放大器初步目录 第一部分:放大器的分类简介 第二部分:使用放大器的一般性规则 第三部分:选择放大器入门 第四部分:使用网络资源 第五部分:数据记录和报告撰写 第六部分:实验和注意事项 附件放大器初步.
    发表于 11-08 09:21

    基于武汉源半导体CW32的无刷电机训练营正式结营!

    2022年6月16日,由武汉源半导体&嘉立创EDA&创工坊科技(深圳)联合举办的,基于武汉源半导体的CW32F030C8T6制作BLDC无刷电机训练营正式结营!感谢嘉立创EDA
    发表于 06-21 15:04

    如何跳过SPL中的ddr训练

    我正在优化启动速度,ddr 训练在 SPL 中需要 360ms,所以我想跳过它。 我厌倦了在 ddr 训练后注意 ddrphy_trained_csr[] 和 g_cdd_max[],
    发表于 06-01 08:16

    imx8mp ddr训练卡住了怎么解决?

    PHY training for 3200MTS我将其追溯到“drivers/ddr/imx/phy/ddrphy_utils.c”中的这个函数 static inline void
    发表于 06-08 06:02

    Cadence宣布推出基于台积电16纳米FinFET制程DDR4 PHY IP

    全球电子设计创新领先企业Cadence设计系统公司(NASDAQ: CDNS)今天宣布,立即推出基于台积电16纳米FinFET制程的DDR4 PHY IP(知识产权)。
    发表于 05-21 09:44 1790次阅读

    Cadence公司发布了关于即将发布的DDR5市场版本以及技术的进展

    DDR5控制器和PHY)的商业版本。最近,该公司发布了一些关于即将发布的DDR5市场版本以及这项技术的进展。
    的头像 发表于 06-08 17:37 5260次阅读

    NVIDIA的Mellanox将采用经验证的DesignWare DDR5/4 PHY IP核

    DesignWare DDR5/4 PHY IP核提供基于固件的训练,无需更改硬件即可进行现场升级,从而帮助客户降低采用新协议的风险。基于固件的训练也有助于使用复杂的
    的头像 发表于 08-28 15:38 2010次阅读

    DDR PHY 与电路板调试

    UltraScale+ MPSoC VCU(H.264/H.265 视频编解码器)连用。 因此,调试将不同于 MIG 等传统 Xilinx DDR 控制器。 DDR PHY 与电路板调试: Zynq UltraScale
    的头像 发表于 02-08 15:51 1465次阅读

    基于FPGA的DDR3SDRAM控制器设计及实现简介

    基于FPGA的DDR3SDRAM控制器设计及实现简介(arm嵌入式开发平台PB)-该文档为基于FPGA的DDR3SDRAM控制器设计及实现简介资料,讲解的还不错,感兴趣的可以下载看看…
    发表于 07-30 09:05 7次下载
    基于FPGA的<b class='flag-5'>DDR</b>3SDRAM控制器设计及实现<b class='flag-5'>简介</b>

    使用DFI的DDR-PHY互操作性

    DDR PHY 接口 (DFI) 用于包括智能手机在内的多种消费电子设备。DFI 是一种接口协议,用于定义在 DRAM 设备之间以及 MC(微控制器)和 PHY 之间传输控制信息和数据所需的信号
    的头像 发表于 05-26 15:27 4970次阅读
    使用DFI的<b class='flag-5'>DDR-PHY</b>互操作性

    DDR phy内存控制器的作用是什么?

    随着 DFI MC-PHY 接口规范的推进,事情正朝着正确的方向发展。对于不熟悉 DFI 的人来说,这是一个行业标准,它定义了任何通用 MC 和 PHY 之间的接口信号和协议。
    的头像 发表于 03-19 12:30 403次阅读