0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

设备故障所导致的随机硬件失效

瑞萨电子 来源:瑞萨电子 作者:克里斯托弗 2021-10-13 14:34 次阅读

汽车原始设备制造商(OEM)一直处于移动出行(Mobility)和高级驾驶辅助系统(ADAS)的前沿,在这个快速发展的领域争夺领导地位。随着这些系统的进步,车辆中半导体元件的数量也随之增加,以应对不断增加的新功能。

面对车用半导体市场如此快速的增长,瑞萨电子开发了许多车用产品,这其中包括微控制器MCU),高度集成的片上系统(SoC) 处理器,存储器以及电源管理系统(PMIC)。

然而,随着行业的发展,问题仍然存在:“我们如何才能在整个行业中标准化这些元件的开发和设计,以便我们能够应对风险并自信地声称该部件在功能上是安全的?”

因此,在ISO 26262的第一版中,汽车行业尝试了开发的标准化,以便将如下所列出的大型系统元件开发时的风险降至最低:

因某些相关关系的遗漏,或不完整的分析所导致的系统性风险

设备故障所导致的随机硬件失效

在过去大约十年的时间里,汽车OEM一直依靠该标准的第5部分(part 5)来帮助他们解决硬件故障,以实现业界公认的“安全”设计。瑞萨电子在产品开发中也采用了类似的标准,通过使用失效模式影响诊断分析(FMEDA)以及相关失效分析(DFA)对我们的产品进行分析,并提出解决设计中随机硬件失效的策略。

在该标准第5部分的基础上,为了应对汽车系统的复杂性,ISO 26262扩大了其覆盖范围,包括进了专门针对半导体元件的第11部分(part 11)。

为了满足提高功能安全的同时降低成本的这一新需求,除了我们的R-Car片上系统处理器之外,瑞萨还为汽车系统设计人员提供多轨、高功率的电源管理系统 (PMIC)。这不仅能够减少元件数量,还能够提供系统开发所需的高性能。

为帮助汽车设计师了解在购买PMIC时需要注意哪些事项,我们将对功能安全设计时所需要的分析进行说明。为了解决在元件层面和系统层面上的相关失效及随机硬件失效问题,瑞萨电子的所有电源产品均采用了类似的架构。这样下次当您发现我们的R-Car套件搭载了瑞萨的PMIC时,您就会对自己的选择充满信心。

1. ISO 26262分析方法

ISO 26262 Analysis Tools

在通读ISO 26262后,我们总结了该规格推荐的3种用于开发符合功能安全的产品的分析方法,具体如下:

框图

失效模式,影响及其诊断分析(FMEDA:Failure Modes Effects and Diagnostics Analysis)

相关失效分析(DFA:Dependent Failure Analysis)

这些方法之所以会被推荐,是因为它们能够降低复杂性的同时完成功能安全的设计。瑞萨电子为了解决随机硬件失效的问题,在设计每一款PMIC产品时都采用了这些分析方法。

向下滑动继续阅读 ↓

1.1 框图(The Block Diagram

通读ISO 26262的规格,可以明显感觉到规格制定者重视的一件事:避免不必要的复杂性。并且,该规格给出了一套制作框图的标准:

对设计进行抽象化,以确保每个区块都有专门的功能,消除不必要的(往往会引起混乱的)混合功能

使用概念安全分析(conceptual safety analysis)对运作流程简化,并对具体功能的执行位置进行最优化

图2显示了此类框图的一个简单示例。

1.2 失效分析方法 (Failure Analysis Tools)

在开始分析之前,我们需要确认规格希望我们在分析中使用的方法。这些方法可帮助我们确认安全机制和其保护对象的相关性(Dependent Failure)以及鲁棒性设计(Robust Design)所允许的故障模式。

DFA:此分析方法有助于我们对相关失效进行识别。例如,当我们想要找出安全机制和其保护对象的元件之间相关失效时,可以使用此方法

下面给出几种利用该分析方法进行识别的常见案例:

VCC:为安全机制供电的电路发生漂移、噪声或故障时,可能会对供电设备产生不利影响

温度:温度的升高或降低可能会影响监测精度的同时,降低其控制某些对象的能力

DFA通过识别并减轻相关关系(Dependencies)的方法,使这些影响得到减轻。

FMEDA:该分析方法在考虑了例如电阻串损坏和漂移等普遍被接受的故障模式的前提下,对功能所受的影响进行分析。同时还可用作失效性模拟器,对ASIL评级的安全范围是否合理的进行确认

DFA需要识别各个功能之间的相关性,而FMEDA则是一种更为直接的方法。FMEDA的目标是调查功能的层次结构并将预想的故障模式应用于每个元素。此处涵盖的故障最初在ISO 26262的第5部分中引入,然后在第二版的第 11 部分中进行了扩展。其中包括:

电阻器故障和元漂移

内存中的软错误率,以及数字逻辑电路中的固定型故障

数据传输失败

在概念设计阶段,将这些故障应用于设计,创建机制来解决故障模式,然后分配覆盖范围。

2. 瑞萨PMIC架构介绍

Introducing Renesas PMIC Architecture

瑞萨电子基于这些分析的结果,定义了产品的主要元素。

基准电压的生成:这通常包括分配带隙和偏置电压的电路

内部电源的生成:为设备的内部元件提供电源的内部电源域

开关:这包括提供输入电压切换的预驱动器和驱动器电路

PWM控制电路:这包括整个控制回路

调节器使能:启用或禁用调节器

数字核心:控制上述要素的构成使其可用于不同的应用

通常,这些系统就是PMIC(电源管理系统)的基本构成要素,如图3所示。

结合DFA和FMEDA,我们可以从概念上分析我们的架构,并考虑追加必要的功能和安全机制,以提高对硬件失效方面的鲁棒性。虽然此分析并非详尽,但它将为我们的数据资料提供一些背景信息

向下滑动继续阅读 ↓

2.1.1 内部轨和偏置生成(Internal Rail and Bias Generation)

瑞萨电子在设计产品时,首先会明确各个要素间的偏置关系。例如,为设备周围的电路提供抽头电压的DAC

我们根据DFA定义了故障模型并总结为以下内容。

共因失效 (CCF:Common Cause Failure):单个故障导致两个独立元件各自发生故障

级联失效(Cascading Failure):一个元件出现的故障导致另一个元件出现故障

将这两种失效模型与图3结合来看,偏置和VCC使用了同一个生成源,如果出现故障,将会影响电压调节和监测机制。

为了解决这个问题,原始架构被更改的更加独立。

图6给出了处理这种相关关系时的一种方法,其中有单独的偏置电路(带隙)和电压DAC来创建各自独立的偏置点。这减少了电路之间的相关性,这也是为什么您会在我们的许多数据表中找到独立的带隙、带隙监测器和VCC监测器的原因。安全要求越严格,解决方案就越复杂。

2.1.2 PWM控制电路和输出开关及驱动器(PWM Control Circuit & Output Switches and Drivers)

在设计反馈回路时,不同的架构决定了不同的性能以及必要的安全机构,因此反馈回路的设计对PMIC尤为重要。具体的失效模式分析示例如下:

由于被固定在高电平或低电平而导致输出切换的故障:这将导致由于直通短路或将输出直接连接到地或 VIN 而导致切换出现无规则性的问题

为防止负载变化期间相对于设定值出现的过度变化的控制回路补偿:这里的潜在故障是,控制器的带宽急剧变化可能导致过压或振荡现象的发生

由于许多故障会导致输出电压偏离其设定值或输出电流超过设备或其负载的安全额定值,因此PMIC需要具有监控输出电流和输出电压的安全机制。这些安全机制通常由比较器或板载模数 (A/D) 转换器来实现。

接下来,我们将用DFA来分析反馈节点。在反馈路径中,通常有一个电阻分压器网络将输出电压转换为内部参考电平。若该电阻器出现故障,目标设定值会变得不正确,并且影响监测机制的监测能力。

因此我们得出了以下标准:

设备需要设置两个独立的反馈源,以解决反馈节点与板上另一个引脚或另一个电压短路的相关故障

这种独立的反馈源需要一个冗余电阻分压器来解决电阻反馈网络任何部分的短路故障模式

出于这个原因,您经常会在我们的产品中看到除了反馈引脚之外还有另一个用于监控的引脚。如果是内置反馈电阻,则大多情况下会为了冗余性而设立其他不同的路径。

对于最后的两节中,我们的焦点将由控制回路转向监测机制。

2.1.3 监视器和控制(Monitors and Controls)

监视器和使能控制可以说是设备中最重要的电路之一,因为它们对于确保系统功能安全的安全机制的实施至关重要。它们由以下一系列比较器电路组成:

过流监测

上电复位监测

输出电压(过压和欠压)监测

内部时钟监测

在进行FMEDA分析时,我们假设比较器输出出现了固定型故障(固定在高位和低位)。在这两个故障中,固定在低位的影响更大,因为在正常操作中会漏掉发生的故障,成为潜在故障。为了提高设备检测出这些低位固定型故障的能力,瑞萨PMIC设置了自检功能 (ABIST)。

数字控制器将输入切换至比较器以生成强制触发,正常运作得到确定后,输入控制再次变为正常模式。

2.1.4 数字内核(Digital Core)

如图9所示,数字内核位于模拟部分附近,并且通常分为负责功能安全相关控制的部分和负责稳压器启动和控制的部分。

这种架构通常更适合用于减少DFA分析所发现的相关关系。为了更好地理解数字内核的结构,请参见图9,其中主要功能包括:

通常由寄存器和一次性可编程 (OTP) 熔丝构成

功能安全相关控制,通常由状态机实现

通信,通常搭载I2C 或 SPI 控制器

在这里,针对一次性可编程(OTP)熔丝阵列和配置寄存器进行数据损(Bit Corruption)相关的FMEDA分析后,能够预想到在启动或者运行时将会出现芯片配置错误的故障。为了防止出现此问题,在启动时和设备配置中定期执行循环冗余计算(CRC)。并且将此方法扩展到通信接口

实现数字部分的安全机制的方法还有很多,除了CRC之外,还有以下列出的安全机制:

必要的冗余逻辑

时钟监测

逻辑BIST(LBIST),与ABIST一样,检查数字逻辑是否存在固定型故障

3. 结论

每个新产品的开发,都会由设计团队和安全团队对功能安全机制进行探讨研究,然后由营销团队将这些新产品的特点进行推广和普及。本文中介绍的概念性分析旨在为读者提供一些捷径,以便于了解瑞萨电子是如何设计ASIL级电源管理产品,以及为何我们会在硬件数据表中列出各种“安全”相关功能的原因。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电源
    +关注

    关注

    182

    文章

    16544

    浏览量

    244673
  • 瑞萨
    +关注

    关注

    32

    文章

    22214

    浏览量

    84912
  • adas
    +关注

    关注

    307

    文章

    2054

    浏览量

    207840

原文标题:工程师说 | 用于为ADAS应用开发的电源系统的功能安全开发工具和方法

文章出处:【微信号:瑞萨电子,微信公众号:瑞萨电子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    是什么原因导致热敏电阻失效

    热敏电阻失效的原因包括环境温度过高或过低、工作电流过大或过小、材料老化以及机械损伤等。了解这些原因并采取相应措施,可避免热敏电阻失效,提高电子设备的稳定性和可靠性。选用品质好的热敏电阻同样重要。
    的头像 发表于 04-08 09:59 127次阅读
    是什么原因<b class='flag-5'>导致</b>热敏电阻<b class='flag-5'>失效</b>?

    是什么原因导致热敏电阻失效

    热敏电阻失效的原因包括环境温度过高或过低、工作电流过大或过小、材料老化以及机械损伤等。了解这些原因并采取相应措施,可避免热敏电阻失效,提高电子设备的稳定性和可靠性。选用品质好的热敏电阻同样重要。
    的头像 发表于 04-08 09:58 109次阅读
    是什么原因<b class='flag-5'>导致</b>热敏电阻<b class='flag-5'>失效</b>?

    晶振失效三大原因及解决办法

    晶振失效三大原因及解决办法 晶振失效是指晶体振荡器无法正常工作,造成电子设备不能正常运行的情况。晶振在电子设备中起到非常关键的作用,它是产生时钟信号的核心元件。晶振
    的头像 发表于 01-24 15:40 482次阅读

    导致MySQL索引失效的情况以及相应的解决方法

    导致MySQL索引失效的情况以及相应的解决方法  MySQL索引的目的是提高查询效率,但有些情况下索引可能会失效导致查询变慢或效果不如预期。下面将详细介绍
    的头像 发表于 12-28 10:01 303次阅读

    什么是宇宙射线?宇宙射线导致IGBT失效的机理

    众所周知,IGBT失效是IGBT应用中的难题。大功率IGBT作为系统中主电路部分的开关器件,失效后将直接导致系统瘫痪。宇宙射线作为一个无法预知的因素,可能就是导致IGBT发生意外
    的头像 发表于 12-27 09:39 815次阅读
    什么是宇宙射线?宇宙射线<b class='flag-5'>导致</b>IGBT<b class='flag-5'>失效</b>的机理

    造成绝缘损坏的原因有哪些?绝缘失效了会导致什么情况?

    老化、设备的设计或制造缺陷、使用过程中的故障等因素引起的。 2. 热损坏:高温是绝缘损坏的常见原因之一。长时间暴露在高温环境下,绝缘材料会发生分解、变硬、变脆等损坏。此外,温度的变化也可能引起绝缘材料的膨胀和收缩,导致
    的头像 发表于 12-19 15:05 2267次阅读

    恒流负载导致的启动故障

    恒流负载导致的启动故障
    的头像 发表于 12-04 15:46 187次阅读
    恒流负载<b class='flag-5'>导致</b>的启动<b class='flag-5'>故障</b>

    失效分析的原因、机理及其过程介绍

    以IGBT、MOSFET为主的电力电子器件通常具有十分广泛的应用,但广泛的应用场景也意味着可能会出现各种各样令人头疼的失效情况,进而导致机械设备发生故障
    的头像 发表于 11-24 17:31 1175次阅读
    <b class='flag-5'>失效</b>分析的原因、机理及其过程介绍

    AD623放大失效怎么解决?

    ,但是放大电路会随机出现失效。出现的时间不定,有时候是连续工作好几天出现一次,有时候是几个小时,甚至是几十分钟出现一次。我不知道是否该用“失效”来描述这种现象,就当是对这个故障的称呼吧
    发表于 11-22 06:30

    共模电感因正负通流不平衡导致饱和失效案例

    共模电感因正负通流不平衡导致饱和失效案例
    的头像 发表于 09-09 08:19 848次阅读
    共模电感因正负通流不平衡<b class='flag-5'>导致</b>饱和<b class='flag-5'>失效</b>案例

    集成电路失效分析

    IC。然而,IC在使用过程中也可能出现失效的情况,从而影响到整个设备的使用效果。因此,对IC失效分析的研究变得越来越重要。 IC失效的原因有很多,例如因为工艺过程中的不良
    的头像 发表于 08-29 16:35 688次阅读

    芯片失效分析方法 芯片失效原因分析

    失效包括硬件失效和软件失效硬件失效是由于电路板需要长时间运行而
    的头像 发表于 08-29 16:29 3117次阅读

    错误、失效故障之间的区别与关系

    的行为或判断。 维基百科定义:错误是指由于人类或系统的疏忽、错误的决策、不正确的数据或计算等导致的系统行为偏离预期或规范。 失效(Failure): 定义:失效是指系统或组件无法按照规定的要求或功能执行工作。 维基百科定义:
    的头像 发表于 06-27 11:06 2753次阅读

    传感器坏了,会导致什么故障现象?

    导致喷油量也随之异常,则燃烧不充分,发动机没劲,在加油过程中冒黑烟。线束连接出问题和传感器失效都会导致故障。解决措施:检查进气压力温度传感器。
    的头像 发表于 06-01 10:45 4550次阅读

    导致半导体制冷片失效的四个主要原因

    通过实际经验及测试发现,导致制冷片失效的原因主要有以下4个方面:1、热应力:失效机理:半导体致冷器工作时一面吸热、一面放热,两面工作在不同的温度上。因为半导体材料和其他部件(导铜和瓷片)的热膨胀
    的头像 发表于 04-28 17:54 3143次阅读
    <b class='flag-5'>导致</b>半导体制冷片<b class='flag-5'>失效</b>的四个主要原因