0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CPLD设计故障异步时钟域处理案例分析

454398 来源:博客园 作者:fpgatalk 2020-10-21 14:25 次阅读

麻雀虽小,五脏俱全。CPLD规模虽小,其原理和设计方法和FPGA确是一样的。轻视在CPLD上的投入,就有可能存在设计隐患,导致客户使用产品时出现故障,从而给公司带来不可挽回的信誉损失。

近一段时间,我遇到了两个CPLD设计故障,这两个故障的根因(root cause)是一样的。其中的一个故障发生在实验室测试阶段,另一个发生在运营商的网络上,造成了非常不好的负面影响,因此引起了高度重视,必须彻底找出原因并消除。虽然可以很容易让故障不复现,但是要想找到根因,并给相关人员解释清楚, 却并不是一件容易的事情。

问题代码:

图 1. 问题代码截图

这段代码的功能是统计 输入信号’status_in’ 的高电平持续时间。CPU写相应的寄存器产生’clr_cnt’把”cnt”清零。同时,也会把”cnt”的值给回读到CPU。实际上就是一个读清操作。

很明显,这里有一个问题,就是异步时钟域处理的问题。’clr_cnt’的时钟为’clk_sys’,而”cnt”的时钟为’clk_io’, ‘clk_sys’和’clk_io’是异步的,没有确定的相位关系。

测试方法:

测试中,CPU循环执行以下四步。

1) 清零: CPU通过Local Bus写寄存器,产生’clr_cnt’脉冲,把”cnt”清零;

2) 计数: CPU等待一段时间。“cnt” 开始对外部输入 ‘status_in’ 计数;

3) 回读: CPU通过Local Bus读取 ”cnt” 值;

4) 循环: goto 1)。

实际实现可能略有不同,CPLD逻辑在执行清零1)的同时会把”cnt”的值锁存下来,供CPU回读,也就是1)和3)也可以是一个步骤。这样表述是为了突出问题代码。

问题描述:

如果’status_in’ 恒为低电平’0’输入, 那么”cnt”应该恒为零值。可是,客户发现一个非常奇观的现象。测试中,让 ‘status_in’ 恒为低电平’0’输入时,客户发现CPU会低概率的回读到非零的”cnt”值。朋友们,你们能解释这种现象吗?

初步分析:

‘status_in’恒为零,不可能引起”cnt”变化。

‘clr_cnt’在测试中是翻转变化的。’clr_cnt’是从’clk_sys’时钟域来的信号。而时钟’clk_sys’和时钟’clk_io’是异步关系,没有固定的相位关系。也就是说’clr_cnt’是可能违反触发器”cnt”的建立/保持时间要求的,进而出现亚稳态。

但是有人认为, “cnt”的值原来是零,“clr_cnt”只是把”cnt”的值清零, 这样来说触发器“cnt”的输入根本没有发生过变化,怎么可能有亚稳态事件? 而且故障出现的概率很高,远比亚稳态的概率高,好像也不能用亚稳态来解释。

问题根因:

要解释问题的真正原因,必须要知道 ”cnt” 对应的电路网表是什么样的。”cnt”电路网表由综合工具(synthesis)生成,可以在综合工具中查看电路图, 图2是网表的局部放大。

图 2. “cnt”的Technology View电路

图2中调用了进位链模块,看起来很乱,整理一下, 手工简化一下如图3。

图 3. 手工简化的“cnt”的电路图

图3中,可以看到,’clr_cnt’和’status_in’相或的结果控制触发器的使能端(‘CE’)。另外,’clr_cnt’还决定了触发器输入(‘D’)是”cnt+1”还是”0”。真值表如下。

也许和你想象中的不一样,电路使用了触发器的两个输入端’D’和’CE’,而不是单单一个’D’端。于是,’clr_cnt’的跳变引起了’D’/’CE’的跳变。

为了说明问题方便,定义 ‘clr_cnt’ 跳变的时刻为t0,这个跳变事件传播到触发器’CE’端的时刻为t1, 传播到触发器’D’端的时刻为t2。见图4。

图4. “cnt”触发器时序违反的演示

图4中的场景, t2》t1》t0。 最初的时候,”cnt”的值为hex”0000”,”cnt+1”的值为hex”0001”。 由于’clk_io’的上升沿落在t1和t2之间, 因此”cnt”错误地跳变为hex”0001”。

一个布局布线后的设计,一般情况下CE的传播延时(t1-t0)不会等于D的传播延时(t2-t0)。由于’clk_io’和’clk_sys’之间的相位关系是随机的, 肯定会出现’clk_io’的上升沿刚好位于t1和t2之间的情况。这种情况下,触发器CNT[15:0]就会错误的采样到”cnt+1”,而不是期望的hex”0000”值。

忽略次要参数和亚稳态事件,故障出现的概率可以被估算为 (t2-t1)/TCLK_IO 。(t2-t1)越大,故障概率越高。这就是为什么故障出现的概率这么高的原因。

显然,对于t2

对于t2=t1的情况(应该没有可能),只有当’clk_io’采样到’D’/’CE’的边沿附近时,引起亚稳态事件,CNT才会出错,当然这种故障的概率会低的多。

图5. “cnt”触发器的后仿真时序违反演示

解决措

通过以上的分析,问题是由于信号跨异步时钟域而产生了模糊的时序关系,布局布线工具无法也不可能分析出这种时序要求,只能从代码上加以处理。

1.同步化

一个很成熟的异步信号同步化方法就是多拍处理。见图6。

图6. 优化过后的代码

‘clr_cnt’经过同步化后, ’clr_cnt_sync’会在’clk_io’上升沿之后很短的时间内稳定下来。布局布线工具通过利用’clk_io’的时钟周期,去约束’clr_cnt_sync’到’D’和’CE’的路径。从而不会出现”cnt”非零的错误。

如果’status_in’也是异步的信号,原理是一样的,会引起计数的不准确,只是故障更隐蔽,同样需要同步化。如果’status_in’是同步的引脚输入,必须通过时序约束告知布局布线工具,’status_in’相对于’clk_io’的建立时间和保持时间。

2.禁止CE

有人提出过一种伪办法,我们来讨论一下。就是约束综合工具,禁止使用触发器的’CE’功能。这样,触发器只有D端口, 且D = ( clr_cnt ) ? “0000” : ( status_in ) ? cnt+1 : cnt 。

当’status_in’==0且”cnt”=”0000”时,D = ( clr_cnt ) ? “0000” : cnt = ”0000”,此时,’clr_cnt’的跳变不会引起D端口上出现跳变,也就不会出现错误的采样。

这样做局限性很大,首先限制了”cnt”=”0000”的状态才适用, 如果”cnt”的当前状态非零,一样会有问题,只是错误会跟隐蔽。再者,使用CE端口可以降低逻辑级数,改善时序,节省面积,实际上可能的情况下应该尽量使用。

因此禁止CE的手段是不能作为解决措施的。
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1600

    文章

    21281

    浏览量

    592867
  • 电路图
    +关注

    关注

    10210

    文章

    10644

    浏览量

    509817
  • cpld
    +关注

    关注

    32

    文章

    1243

    浏览量

    168241
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10412

    浏览量

    206467
  • 触发器
    +关注

    关注

    14

    文章

    1674

    浏览量

    60382
收藏 人收藏

    评论

    相关推荐

    异步电路中的时钟同步处理方法

    异步电路中的时钟同步处理方法  时钟同步在异步电路中是至关重要的,它确保了电路中的各个部件在正确的时间进行操作,从而使系统能够正常工作。在本
    的头像 发表于 01-16 14:42 312次阅读

    同步电动机和异步电动机故障的原因分析

    电动机   异步电动机故障原因分析如下:   (1)轴承过热——润滑不良。   (2)绕组绝缘电阻太低——潮湿、局部绝缘材料老化。   (3)空气冷却器冷却能力下降——水压力低、水压温度高、冷气堵塞。   (4
    发表于 12-21 07:28

    IC设计:ram的应用-异步时钟域位宽转换

    在进行模块设计时,我们经常需要进行数据位宽的转换,常见的两种转换场景有同步时钟域位宽转换和异步时钟域位宽转换。本文将介绍异步时钟域位宽转换
    的头像 发表于 11-23 16:41 365次阅读
    IC设计:ram的应用-<b class='flag-5'>异步</b><b class='flag-5'>时钟</b>域位宽转换

    为什么异步fifo中读地址同步在写时钟域时序分析不通过?

    为什么异步fifo中读地址同步在写时钟域时序分析不通过? 异步FIFO中读地址同步在写时钟域时序分析
    的头像 发表于 10-18 15:23 345次阅读

    光伏逆变器常见故障分析处理维修

    光伏逆变器常见故障分析处理 一、电气量故障: 1、直流侧过、欠电压: 故障原因分析:大气过电压
    的头像 发表于 10-16 15:55 2160次阅读

    三相异步电动机的故障分析

    一、故障概述 三相异步电动机的故障一般分为电磁故障和机械故障两大类。 1、电磁故障 电磁方面的
    的头像 发表于 10-11 10:26 965次阅读

    异步时钟同步疑惑

    ?也就是说采样异步时钟信号时不打拍有什么后果? 另外,当高速时钟采样慢速上升沿或下降沿时,采样结果抖动怎么处理?比如DS18B20长线驱
    发表于 09-12 20:39

    关于FPGA设计中多时钟域和异步信号处理有关的问题

    减少很多与多时钟域有关的问题,但是由于FPGA外各种系统限制,只使用一个时钟常常又不现实。FPGA时常需要在两个不同时钟频率系统之间交换数据,在系统之间通过多I/O接口接收和发送数据,处理
    的头像 发表于 08-23 16:10 361次阅读

    请问安路CPLD可否提供内部时钟

    安路CPLD可否提供内部时钟
    发表于 08-11 09:14

    CoreLink™ADB-400AMBA®桥接循环模型用户指南

    AMBA®桥(ADB)在AMBA系统中集成了多个电源或时钟,或不同的电压电平。它提供了两个组件或系统之间的异步桥接。它还支持时钟可用性管
    发表于 08-10 06:25

    时钟设计:异步FIFO设计

    在ASIC设计或者FPGA设计中,我们常常使用异步fifo(first in first out)(下文简称为afifo)进行数据流的跨时钟,可以说没使用过afifo的Designer,其设计经历是不完整的。废话不多说,直接上接口信号说明。
    的头像 发表于 07-31 11:10 1332次阅读
    跨<b class='flag-5'>时钟</b>设计:<b class='flag-5'>异步</b>FIFO设计

    异步电路的跨时钟处理

    异步电路不能根据时钟是否同源来界定,时钟之间没有确定的相位关系是唯一准则。
    的头像 发表于 06-27 10:32 662次阅读

    异步时钟的同步处理

    异步系统中,由于数据和时钟的关系不是固定的,因此会出现违反建立和保持时间的现象。
    的头像 发表于 06-05 14:34 1963次阅读
    <b class='flag-5'>异步</b><b class='flag-5'>时钟</b>的同步<b class='flag-5'>处理</b>

    高级FPGA设计技巧!多时钟异步信号处理解决方案

    特定的方式下根据指定的要求才能进行跨时钟的时序分析。 4、通常来说,如果没有很好地理解,跨时钟故障
    发表于 06-02 14:26

    如何区分同步复位和异步复位?

    的原始状态(指所有需要管理的内部信号和外部信号)开始工作,而对这些原始状态的初始化,则是复位电路的职能。 3、激励和响应,应用于同步电路中,相同时钟的潜伏期分析,根据单拍潜伏期规律(或定律),适合所有信号。但你的问题应该明确
    发表于 05-22 17:33