在某产品的调试中发现,板上核心处理芯片在每次启动后的表现不同,偶尔会出现无法启动的故障。
经过几百次反复上下电测试发现,在大多数情况下,芯片启动后能正常工作,但有约2%的概率会出现芯片无法启动的问题。
【讨论】
在故障发生时,由于芯片并没有完全挂死,工程师可以通过底层软件查询芯片内部寄存器,从而通过寄存器找到故障诊断的线索。这种方法是CPU、核心处理器等芯片故障调试的重要手段之一。但是,在该芯片故障的调试中发现,在芯片每次启动出故障时,片内寄存器的参数值是不同的。这就使得若以寄存器作为故障诊断的线索,可能会出现多个可能的调试方向。
一个重要的调试经验是,对于大多数故障,故障的表现方式可能有很多种,但故障的根源很可能是唯一的。
基于这项调试经验,若故障表现具备一致性,我们可以采用逆推的方式,也就是通过故障表现逆向推出故障根源。但是,若故障表现不具备一致性,则不宜采用逆推的分析方式 。
对于本案例,寄存器参数值只是故障的表现,而不是导致故障的根源。由于在每次上电出现故障的过程中,芯片寄存器的状态并不完全相同,因此继续执着于对寄存器的研究可能就不是个好策略了,此时应该回到上电工作的本身,通过波形测试,寻找其他线索。
该芯片有12种供电电源,经过多次对上电电源波形的捕捉,发现有一个给芯片内核供电的电源上电波形存在台阶,不论芯片是否能正常启动,该台阶都存在。同时捕捉该路 电源上电电压波形和电流波形,发现在电压出现台阶的瞬间,该路电源的负载电流会突然增大 。
可以推测电压出现台阶的原因是,在上电过程中,当电压爬升到某位置,负载芯片电流突然增大,导致电源环路无法迅速响应负载突变能量的需求,只能依靠电源输出端的电 容向负载提供能量,导致在这个瞬间电压无法继续上升,并伴随电容放电而略微向下,在波形上表现为台阶。在一段延时之后,电源环路使能量传递恢复,电源电压才能继续上升,但在这之前,电源能量无法完全满足芯片的需求,可能造成芯片内部紊乱,表现为无法正常启动,寄存器出现各式错误。
该问题的解决方案有:
①优化电源环路响应速度。
②在电源和负载芯片之间加入MOS管,等电源启动完成并稳定后再开启MOS管。在负载启动瞬间存在较大突变电流的应用中,如果同时进行电源上电和负载启动,有可能出现与本案例类似的问题。通过MOS管将二者之间的关联断开是解决这类问题的一种方法。
③利用对复位等信号的控制,修改芯片启动流程,使芯片的启动在板上所有电源上电完成后再进行。
本案例最终的解决方案是,通过调整控制信号发出的时序,将芯片启动时间向后延 迟,在板上所有电源上电结束或接近结束时再开始芯片的启动。在采用这种解决方案时, 需注意研究芯片上电初始化流程的具体要求。
【扩展1】
本质上,本案例的故障是由于电源启动和芯片启动同时进行导致的。当这两种启动同时发生时,电源输出能量不仅需满足输出端大电容的充电,还需满足负载的用电需求。许多核心处理芯片在启动瞬间会出现负载电流的迅速增大,该电流可能远大于芯片稳态工作时的最大电流值,这种情况下,同样处于启动过程中的电源很可能无法满足突变负载电流的需求,从而造成启动过程中电压的跌落。
【扩展2】
上电测试是电路测试中一项非常关键的项目。
本案例中的电路,在调试早期已经经过了初步的上电测试,包括电源上电波形的测量等,但工程师未发现电源轨道上存在台阶的问题。原因是,该台阶太小,若不将示波器时间轴拉开,是无法看清楚的。
这是电源上电波形测量中很常见的问题之一。由于芯片有上电顺序的要求,各电源上电轨道存在相对时延,有的工程师为了在示波器屏幕上同时观察几个电源轨道的上电波形,会将示波器时间轴设置到ms级甚至10ms级,在这种情况下是很难发现上电波形边沿上台阶、振荡等现象的。
通常而言,在电路中有许多看上去很困难的问题,在解决后往往发现问题本身并不复杂,只是前期的某项基本测试项目没有正确地进行,或没有对波形进行正确的分析,导致问题被掩盖了。在多年的工作中,笔者深刻地体会到,测试这项工作,或者就不做,而如果要做,务必采用正确的测试方法、获得正确的波形,并对波形等测试数据做认真的分析。错误的测试得到错误的结果,辛苦测得了大批数据而不做细致分析,不仅浪费时间,而且造成误判,是复杂问题调试中必须避免的。
【扩展3】
有的工程师提出可以利用缓启动电路解决本案例提到的问题,这个方案是不正确的。
缓启动电路的使用,用得好能解决电压冲击、电流冲击的问题;用得不好则很可能导致电路间歇性上电故障的问题。尤其是某些大功率核心处理芯片,在启动瞬间需要极大的电流,若在电源通路上加上缓启动电路,则在芯片启动过程中,芯片内核更加难以得到所需能量,从而可能进入错误的状态。
很多芯片对电源上电爬升速度有最小、最大值的要求,不能太快,也不能太慢,这是设计中值得注意的。
【扩展4】
上电时,在电压波形上出现台阶是常见的,显然并非任何上电台阶都会造成电路启动故障 。
-
芯片
+关注
关注
462文章
53534浏览量
459120 -
cpu
+关注
关注
68文章
11216浏览量
222945 -
MOS管
+关注
关注
110文章
2752浏览量
74925
发布评论请先 登录
开关稳压电源电路故障表现分析
如何使用Ozone分析Cortex-M故障?
矿井地面变压器的异常运行和常见故障分析
常见电源模块使用异常故障问题分析
自耦降压启动故障排除
柔性测斜仪数据异常故障分析及解决方法
【案例3.9】电路板无法启动的故障分析

【案例2.36】芯片启动异常的故障分析
评论