0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

lhl545545 来源:ZLG致远电子 作者:ZLG致远电子 2020-06-09 16:30 次阅读

总线关闭是CAN节点比较重要的错误处理机制。在总线关闭状态下,CAN节点的恢复流程是怎样的?如何理解节点恢复流程的“快恢复”和“慢恢复”机制?本文将为大家详细分析总线关闭及恢复的机制和原理。

故障界定与总线关闭状态

为了避免某个设备因为自身原因(例如硬件损坏)导致无法正确收发报文而不断的破坏总线的数据帧,从而影响其它正常节点通信,CAN网络具有严格的错误诊断功能,CAN通用规范中规定每个CAN控制器中有一个发送错误计数器和一个接收错误计数器。根据计数值不同,节点会处于不同的错误状态,并根据计数值的变化进行状态转换,状态转换如下图所示。

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

图1 节点状态转换图情形1

以上三种错误状态表示发生故障的严重程度,总线关闭是节点最严重的错误状态。并且,节点在不同的状态下具有不同的特性,在总线关闭状态下,节点不能发送报文或应答总线上的报文,也就意味着不能再对总线有任何影响。

状态跳转和错误计数的规则使得节点在发生通信故障时有了较好的自我错误处理和恢复机制,从一种较严重的错误状态跳转到另一种严重性相对较低的状态,本质上就是一种恢复过程。图1所呈现的转换过程是CAN通用规范所要求的,我们从设备供应商买回来的CAN控制器已经把这些功能固化在硅片之中。

在通信过程中,错误主动和错误被动两种状态下节点的恢复过程一般不需要MCU进行额外的编程处理,直接使用CAN控制器固有功能即可。但对于总线关闭状态,往往不直接使用CAN控制器固有的恢复过程,而是对其进行编程控制,以实现“快恢复”和“慢恢复”机制。

注:1、由于篇幅有限,关于错误计数的详细规则以及各状态下节点的具体特性不在本文进行讨论,读者可以查阅CAN的相关协议规范。2、本文的“CAN控制器”是指已经实现了CAN通用协议物理层和数据链路层所要求的功能和特性的器件,如SJA1000;而“节点”是指把CAN控制器与MCU、收发器等相关器件进行整合开发出来的具有一定功能的CAN节点。

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

当节点进入总线关闭状态后,如果MCU仅是开启自动恢复功能,CAN控制器在检测到128次11个连续的隐性位后即可恢复通信,在实际的CAN通信总线中,这一条件是很容易达到的。

以125K的波特率为例,128*11*(1/125000)= 0.011264s。这意味着如果节点所在的CAN总线的帧间隔时间大于0.011264s,节点在总线空闲时间内便可轻易恢复通信。我们已经知道,当进入总线关闭状态时,节点已经发生了严重的错误,处于不可信状态,如果迅速恢复参与总线通信,具有较高的风险,因此,在实际的应用中,往往会通过MCU对CAN控制器总线关闭状态的恢复过程进行编程处理,以控制节点从总线关闭状态恢复到错误主动状态的等待时间,达到既提高灵活性又保证节点在功能上的快速响应性的目的。具体包括“快恢复”和“慢恢复”策略,两种策略一般同时应用。

通过以上的讨论,我们可以知道,节点进入总线关闭状态后,存在以下几种恢复情况:

MCU仅开启CAN控制器的自动恢复功能,节点只需检测到128次11个连续的隐性位便可以恢复通信,恢复过程如图1所示。

MCU没有开启CAN控制器的自动恢复功能,也不主动干预总线关闭错误,节点将一直无法“自动”恢复总线通信,只能通过重新上电的方式使节点恢复, 恢复过程如图2所示。

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

图2 节点状态转换图情形2

MCU对CAN控制器的恢复过程进行编程处理,这时,节点的恢复行为由具体的编程逻辑决定,各厂家普遍采用了先“快恢复”后“慢恢复”的恢复策略,恢复过程如图3所示。

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

图3 节点状态转换图情形3

MCU如何实现“快恢复”和“慢恢复”?

MCU编程实现总线关闭“快恢复”和“慢恢复”的一般过程可用以下流程图描述:

图4 MCU实现总线关闭恢复流程

节点以正常发送模式发送报文的过程中,如果出现了发送错误,发送错误计数会增加,只要发送错误计数没有超过255, CAN控制器便会自动重发报文,如果出现多次发送错误,使发送错误计数累加超过255,则节点跳转为总线关闭状态。MCU能够第一时间知道节点进入了总线关闭状态(例如在错误中断处理逻辑中查询状态寄存器的相应位),这时MCU控制CAN控制器进入“快恢复”过程,即控制CAN控制器停止报文收发,并进行等待,计时达到需要的时间T1(如100ms)后,MCU重新启动恢复CAN控制器参与总线通信,这样便完成了一次“快恢复”过程。

节点每进入一次“快恢复”过程时,MCU会对此进行计数,当节点“快恢复”计数达到设定的值N(如5次),则后续再次进入总线关闭状态时MCU把恢复总线通信的等待时间T2进行延长(如1000ms),这样便实现了“慢恢复”过程。“快恢复”和“慢恢复”过程的主要区别就在于恢复节点参与总线通信的等待时间的不同。

通过MCU对于总线关闭后的恢复行为进行编程控制,实际上是对CAN控制器的错误管理和恢复机制进行了补充,使得总线关闭状态后的恢复过程更加灵活,更能适应实际应用的需要。对于 “快恢复”和“慢恢复”的等待时间,以及“快恢复”计数多少次后进入“慢恢复”过程,不同厂家可根据具体的需求进行编程实现。

实测总线关闭恢复过程

通过广州致远电子有限公司的CAN总线分析仪的流量分析功能,可以很方便分析总线关闭后节点的恢复过程及测试“快恢复”和“慢恢复”的恢复时间。

第一步,连接DUT但先不要上电。按以下配置,使能接收干扰功能,并开启报文读取功能。

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

图5 功能设置

第二步,给DUT上电,并采集一段时间报文,停止采集后使用流量分析功能进行分析。

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

图6 采集报文并进行流量分析

第三步,鼠标放置于波形“团”(本文把包含多帧密集帧的波形称为波形“团”)之间读取恢复时间。

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

图7 读取恢复时间

至此,我们便可以得出结论:该DUT对总线关闭的恢复过程进行了编程控制,采用了先“快恢复”后“慢恢复”的恢复机制,节点进入总线关闭状态后,进行一次“快恢复”过程,后续进行“慢恢复”过程,两个恢复过程的恢复时间分别为27.5ms和209.5ms。

那么,我们该如何根据所得波形理解该DUT进入总线关闭状态及恢复通信的整个过程呢?

把第一个波形“团”放大得到下图:

为什么需要对总线关闭状态的节点实现“快恢复”和“慢恢复”策略?

图8 放大波形“团”观察

可以清晰的看到,波形“团”中包含共32帧CAN报文。把其余各波形“团”放大后也都是包含32帧,这里不再把详细的图片贴出来。

DUT上电后,初始发送和接收错误计数都为0。由于在测试时配置了接收干扰功能,当DUT开始发送报文后,每一帧报文都受到CAN总线分析仪的干扰而出现发送错误,第一次发送时发送错误计数加8,并自动重发,第二次发送时错误计数再加8,直到发送了32次后,发送错误计数大于255,根据图3的错误状态的转换规则,这时DUT跳转为总线关闭状态,MCU控制进入“快恢复”过程同时对“快恢复”次数进行计数,并等待约27ms后,MCU控制DUT从总线关闭状态恢复为错误主动状态,由MCU继续启动发送,由于仍然受CAN总线分析仪的持续干扰,发送32帧后再次进入总线关闭状态,再次执行“快恢复”或“慢恢复”过程,以此类推。

根据流量分析的结果可知,该DUT进入“快恢复”的计数达到1次后便执行“慢恢复”过程,“慢恢复”等待时间约为209ms。

注:1、干扰的设置可以根据需要设置其他的参数,只要保证能对DUT发送的帧进行干扰使其出现发送错误即可。2、为了分析完整的总线关闭恢复过程,建议DUT和CAN总线分析仪连接好后,先开启“报文读取”和“接收干扰”功能后再上电DUT。因为这样能确保DUT的接收错误计数和发送错误计数的初始计数都为0。3、需要对DUT进行连续的干扰,否则DUT恢复后成功发送了报文,“快恢复”次数的计数会递减,这不利于分析DUT总线关闭后的整个恢复行为。 4、总线关闭后节点的“恢复”是指恢复参与总线的通信,但并不意味着恢复后一定能成功发送或接收报文。如上述案例,DUT恢复通信后由于仍然受CAN总线分析仪的干扰,导致报文发送再次失败。

总结

在总线关闭状态下,“快恢复”和“慢恢复”不是CAN控制器固有的功能,而是通过MCU的编程逻辑实现的恢复机制,是总线关闭状态下恢复过程的补充,使恢复过程更具有灵活性。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6504

    浏览量

    87444
  • 总线
    +关注

    关注

    10

    文章

    2680

    浏览量

    87048
  • CAN节点
    +关注

    关注

    0

    文章

    8

    浏览量

    9028
收藏 人收藏

    评论

    相关推荐

    请问TC275造busoff故障后的状态标志位是哪个?

    1.先关闭busoff恢复,然后造busoff的故障2.去读取CAN_NSRx寄存器的BOFF位,一直为0 现在想做busoff的快慢恢复策略,就想通过进入busoff的
    发表于 02-06 07:26

    【vsan数据恢复】VSAN超融合基础架构数据恢复案例

    盘,2个机械硬盘作为容量盘。三台服务器节点上共配置6个磁盘组,共同组成VSAN存储空间,存放虚拟机文件。 需要恢复服务器节点上的数据库数据。 VSAN故障: 非正常关机导致V
    的头像 发表于 01-15 11:33 260次阅读
    【vsan数据<b class='flag-5'>恢复</b>】VSAN超融合基础架构数据<b class='flag-5'>恢复</b>案例

    恢复二极管的作用有哪些

    够快速地从正向导通状态切换到反向截止状态,并在反向击穿时承受高电压。 快恢复二极管采用特殊的材料和结构设计,以实现更快的反向恢复时间和更低的
    的头像 发表于 01-12 15:53 343次阅读
    快<b class='flag-5'>恢复</b>二极管的作用有哪些

    单独使用AD7606采样,偶尔出现ADC死掉的状态需要重启才能恢复是为什么?

    状态需要重启才能恢复 ; 电路设计:采集板基于CN-0148 设计,参数和电路沿用该文档; 请问这是什么原因导致的?
    发表于 12-22 07:38

    什么是快恢复二极管?快恢复二极管的作用?快恢复二极管有哪些呢?

    、整流器、变频器等。下面将详细介绍快恢复二极管的作用以及一些常见的快恢复二极管。 快恢复二极管的作用主要体现在以下几个方面: 1. 整流器:快恢复二极管可以将交流电转化为直流电,
    的头像 发表于 12-21 10:26 1246次阅读

    linux恢复远端备份文件

    在Linux系统中,恢复远端备份文件是一项非常重要的工作。当我们的数据丢失或损坏时,从备份文件中恢复数据可以帮助我们恢复到之前的状态。在本文中,我将详细介绍如何在Linux系统中
    的头像 发表于 11-23 10:08 211次阅读

    恢复二极管有什么用

    的材料组合,使得它可以迅速地从正向导通状态转为反向截止状态,并且在反向击穿时可以承受高电压。 快恢复二极管的结构特点 快恢复二极管的内部结构与普通二极管不同,它是在P型、N型硅材料中间
    的头像 发表于 11-20 16:59 643次阅读
    快<b class='flag-5'>恢复</b>二极管有什么用

    服务器数据恢复-VSAN数据恢复方案

    块机械硬盘。 故障描述:一个节点服务器掉线,导致部分虚拟机无法访问。 期望恢复数据:恢复VSAN环境中故障虚拟磁盘数据。
    的头像 发表于 10-31 14:15 258次阅读

    富捷快恢复二极管详细应用于介绍

    恢复二极管(Fast Recovery Diode)是一种特殊设计的二极管,用于高频开关电路和高速电源开关应用中。它具有快速恢复时间和低反向恢复电荷,能够在开关过程中迅速地恢复到截止
    的头像 发表于 06-24 13:41 1066次阅读
    富捷快<b class='flag-5'>恢复</b>二极管详细应用于介绍

    掉电保护如何恢复原来的工作状态

    掉电保护是系统在掉电之后能够对相关数据进行存储的一种方式,系统运行中所采集或产生的数据常常要求在电源掉电时不被丢失,重新加电后系统能恢复原来的工作状态
    的头像 发表于 05-17 09:35 806次阅读
    掉电保护如何<b class='flag-5'>恢复</b>原来的工作<b class='flag-5'>状态</b>

    MPC5775B上的MCAN,CAN总线关闭后要做什么?

    这是我第一次为 MCAN 设备编写代码。它基本上可以正常工作,但我想知道如何处理停运。对于其他设备,我知道诸如“总线关闭自动恢复”之类的配置设置,而且我不必为补救措施编写代码。硬件本身做了所有适当
    发表于 03-30 06:56