0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

合宙基于移芯平台的模块死机问题详解

青山老竹农 来源:jf_82863998 作者:jf_82863998 2024-08-20 11:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们在分析模块死机原因的时候主要会用到两个工具:luatools和EPAT

相关关联文档和下载地址如下:

Ramdump里分析内存泄漏问题

无法抓底层log的情况下如何导出死机dump

Luatools下载调试工具

EPAT抓取底层日志

Flashtools_v4.1.9下载

luatools和EPAT这2个工具,具体使用方法要了解,本文不做深入讲解,EPAT抓取底层日志文档内有详细使用说明

luatools用于捕获从USB口的用户log,即luat_debug_print输出的log,仅用于csdk和luatos。AT版本没有用户log和用户串口通道,需要使用EPAT工具抓取。

EPAT用于捕获USB口,UART0(DBG_UART串口) 的底层log,在luatools没有开启的时候,EPAT同样捕获用户log的大部分内容,这个时候用户log会从底层log输出,标识为luatos,等级为error,所以不要把用户log当做error!

luatools捕获用户log时,自动识别GB2312还是UTF8编码,也能正确打印64bit数据和浮点数据

EPAT只能识别GB2312编码,不能正确打印64bit和浮点数据,在用UART0捕获数据时会丢失部分log,尤其是优先级低的,所以用户log的等级是error,优先级高

双方都是USB口对接的情况下,USB虚拟串口没有波特率限制,任意选择,实际传输速率都是一样的

为啥要区分用户log通道和底层log通道,因为移芯不开放底层log解析方法

csdk固件默认死机后存储死机信息到flash后重启,luatos固件死机后会存储死机信息到flash,然后等EPAT或者luatools抓取死机信息,等待大约40秒左右会重启。

一、出现死机问题分析

A 怎么抓LOG

A1 认识USB虚拟串口

由于电脑识别出来串口名字都是一样的,因此需要从串口属性上来区分对应功能,具体看下面截图红框

A1.1 用户log通道

wKgZomaaFwWASNeYAACrVioBmcQ761.png

A1.2 底层log通道

wKgZomaaFw2AFVo4AACqCeVAnSI621.png


A1.3 用户串口通道

wKgaomaaFxWAbyycAACpqmi_dsg684.png


A2 抓log

如果使用EPAT工具抓取日志,说明请看 EPAT抓取底层日志文档

A2.1 USB可用

建议方案1,只用luatools勾选USB打印模式即可,没有配置上的要求,luatools会自动识别log通道,需底层log的,工具配置--》log--》勾选ap log,luatools会自动识别log通道,底层log保存在log/4gdiag。luatools版本必须在2.2.1及以上

建议方案2,直接用EPAT,按照EPAT手册操作即可,如果luatools开着,工具配置--》log--》不要勾选ap log

A2.2 USB不可用

只能用EPAT通过DBG_UART抓LOG了,需要6M波特率抓取(USB转TTL工具也要支持6M波特率),如果是AT版本还需要通过发送以下指令配置

AT+ECPCFG=logCtrl,2             // 输出全部日志
AT+ECPCFG=logPortSel,1          // 只从DBG_UART串口输出日志
AT+ECPCFG=logBaudrate,6000000   // 设置波特率为6M

B 遇到死机怎么办

设置死机不重启方法

AT固件:发送 AT+ECPCFG="faultAction",0 或者 AT*EXASSERT=1 指令开启死机不重启。

LuatOS开发:调用 mcu.hardfault(0) 接口开启死机不重启。

CSDK开发:在task中执行 luat_debug_set_fault_mode(LUAT_DEBUG_FAULT_HANG); 开启死机不重启。

B1 EPAT抓底层log,固件设置成死机不重启

EPAT会自动抓,并且自动弹出ramdump处理界面,按照手册操作即可。

B2 luatools抓底层log,固件设置成死机不重启

luatools也会自动抓ramdump,但是只能保存成文件,仍然需要用EPAT来手动进入处理ramdump界面,后续处理见B1

B3 固件设置成死机重启,或者没有工具抓底层log

帮助文档:无法抓底层log的情况下如何导出死机dump

C 死机重启原因常见情况分析

死机需要底层log和ramdump处理结果综合判断,luatos固件还要看用户log,这里讨论如何定位出错代码位置或者出错原因

C1 luavm抛出的异常

这个看用户log就行,如果开启了errdump,还能在iot平台上看到

C2 断言死机

看底层log就可以,搜索EcAssert字样,可以看到断言的位置

如果没有底层log,ramdump里需要看list source的代码上下是不是调用了ec_assert_regs,然后在stackframe with local里看看调用顺序,大概率能看到断言的位置。

断言死机如果是malloc失败,那么就是ram不足了。

C3 内存不足

这是最常见的死机原因,而且9成9可以判断是内存泄露,剩下也有可能malloc时的参数不对,申请了不可能申请到的空间大小。内存不足直接表现,C2中已有部分描述,如果有底层log,还可以从死机时打印的信息来判断

wKgaomaaFyGAE7sjAAMkNBsNIV0748.png

这里表示动态分配ram时,最大的block只有712字节了,这是非常典型的内存不足引起的死机,正常来说,至少要有个70KB左右的空间来满足LTE协议栈的需求

如果ramdump信息完整,则可以从ramdump里找到查找方向从Ramdump里分析内存泄露问题

C4 看门狗死机

在底层log和ramdump里都能看到,

wKgZomaaFymAQeTOAAC0ATfKQoM742.png

ramdump里能看到最后停在NMI Handler里。

看门狗死机,要么死循环,要么操作时间太长,消除死循环,或者主动喂一下狗。压力测试和RSA运算时特别注意一下。

C5 疑难杂症

真正遇到hardfault时,需要先从底层日志里看死机的直接原因,也就是arm内核遇到的致命错误,当然多种多样,常见的地址错误(常见data access)有数据存取时的总线错误(常见precise data access,imprecise data access等等),指令错误(常见switch to an invalid state (e.g., ARM))等等。

以下个人经验:

先要排除一下栈溢出的可能,一旦栈溢出,什么奇怪的现象都有可能发生,运气好的,触发断言,运气不好的,就什么错误都可能发生,任务链表都可能被破坏,导致ramdump里的信息都会缺失。

1.ramdump信息完整

如果ramdump信息完整,则可以从ramdump大致分析出有没有栈溢出现象从Ramdump里看栈溢出

如果ramdump的信息看起来完整,stackframe with local里调用顺序也比较合理,那么就能定位发生问题的函数和语句,后续就看代码调试吧,这是比较理想的情况。

地址错误的,大概率是读写了一个不可读写的地址,但是注意,有时候非ram和flash地址,直接读取并不一定会出错。

总线错误,大概率是数据对齐的问题,比如uint32_t *指针,去读取一个uint8_t *指针指向的内容,一旦uint8_t *指针存放的地址不是32位对齐的,编译器又没有对应优化处理,死机是很正常的

指令错误,这种常见的函数指针用出问题,导致函数退出时,PC指针已经不能指向正确的代码指令,从而执行了非arm的指令

2.ramdump的信息不完整

如果ramdump的信息都不完整,底层log也丢完,或者压根没法抓,建议通过删减代码,加打印语句等方法来定位出错的语句,多次尝试缩小范围,直到成功,有经验,对源码了解的,能加快这一进度。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2822

    浏览量

    52815
  • 死机
    +关注

    关注

    0

    文章

    17

    浏览量

    8778
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    昇案例入选中国企业改革与发展研究会“2025央企产业链创新发展优秀案例”

    近日,由中国企业改革与发展研究会主办的2025年(第三届)企地合作论坛在京举行。由中物联与中昇共同撰写的“企地协同,共建RISC-V产业生态”案例,成功入选“2025央企产业链创新发展优秀
    的头像 发表于 12-01 17:03 1013次阅读
    中<b class='flag-5'>移</b><b class='flag-5'>芯</b>昇案例入选中国企业改革与发展研究会“2025央企产业链创新发展优秀案例”

    昇第四款芯片入选国资委《中央企业科技创新成果推荐目录》

    近日,为加快中央企业科技创新成果应用推广,加速科技成果向现实生产力转化,国资委发布了《中央企业科技创新成果推荐目录(2024年版)》。中国移动旗下专业芯片公司中昇研发的“RISC-V内核SIM
    的头像 发表于 12-01 17:03 1032次阅读
    中<b class='flag-5'>移</b><b class='flag-5'>芯</b>昇第四款芯片入选国资委《中央企业科技创新成果推荐目录》

    在rt-thread4.0.2版本stm32f407硬件平台上,使用reboot命令无法重启,会让系统死机的原因?

    我在rt-thread4.0.2版本stm32f407硬件平台上,使用reboot命令无法重启,会让系统死机。 reboot命令默认是调用rt_hw_cpu_reset()
    发表于 09-12 06:08

    远通信飞鸢AIoT大模型应用算法成功通过备案

    近日,第十二批境内深度合成服务算法备案信息发布,远通信"飞鸢AIoT大模型应用算法"榜上有名。这标志着该算法在技术规性、安全可控性及社会价值上获得权威认可,彰显了远通信在
    的头像 发表于 08-06 08:48 721次阅读
    <b class='flag-5'>移</b>远通信飞鸢AIoT大模型应用算法成功通过备案

    芯片制造中的键技术详解

    技术是通过温度、压力等外部条件调控材料表面分子间作用力或化学键,实现不同材料(如硅-硅、硅-玻璃)原子级结合的核心工艺,起源于MEMS领域并随SOI制造、三维集成需求发展,涵盖直接键(如SiO
    的头像 发表于 08-01 09:25 1530次阅读
    芯片制造中的键<b class='flag-5'>合</b>技术<b class='flag-5'>详解</b>

    远通信加入 Avanci 5G 车联网专利平台,强化全球业务护航能力

    尊重和积极发展知识产权置于核心地位,积极拥抱行业发展,为客户创造价值。   加入Avanci 5G 车辆项目,将进一步增强远通信在专利平台流程与规要求方面的能力,强化自身对客户在标准必要专利许可谈判及专利
    的头像 发表于 07-22 13:59 2688次阅读

    远通信加入 Avanci 5G 车联网专利平台,强化全球业务护航能力

    和积极发展知识产权置于核心地位,积极拥抱行业发展,为客户创造价值。加入Avanci5G车辆项目,将进一步增强远通信在专利平台流程与规要求方面的能力,强化自身对客户
    的头像 发表于 07-22 12:11 571次阅读
    <b class='flag-5'>移</b>远通信加入 Avanci 5G 车联网专利<b class='flag-5'>平台</b>,强化全球业务护航能力

    昇5G-A蜂窝无源物联网芯片亮相巴塞罗那世界移动通信大会

    3月3至6日,2025年世界移动通信大会(MWC25)在西班牙巴塞罗那盛大举行。中昇芯片产品5G-A蜂窝无源物联网芯片在大会上亮相,全面展示中昇在芯片研发领域的技术创新力,与全
    的头像 发表于 03-06 16:00 1358次阅读
    中<b class='flag-5'>移</b><b class='flag-5'>芯</b>昇5G-A蜂窝无源物联网芯片亮相巴塞罗那世界移动通信大会

    一文详解共晶键技术

    技术主要分为直接键和带有中间层的键。直接键如硅硅键,阳极键等键
    的头像 发表于 03-04 17:10 2322次阅读
    一文<b class='flag-5'>详解</b>共晶键<b class='flag-5'>合</b>技术

    华为支付-平台类商户单支付场景准备

    一、场景介绍 用户在商户开发的APP应用/元服务上购买了一个旅行套餐,包含机票、保险、酒店等这几个不同的产品对应不同的收单商户,但用户是一次支付。平台类商户通过接入单支付将多个不同商户的订单合到
    发表于 02-11 10:40

    昇安全MCU芯片通过开源鸿蒙生态认证

    近日,昇科技有限公司(以下简称:中昇)安全MCU芯片CM32M435R顺利通过开源鸿蒙生态认证,获得生态产品兼容性证书,这是公司通过的第一款鸿蒙认证的芯片产品,为中
    的头像 发表于 02-11 09:22 1003次阅读
    中<b class='flag-5'>移</b><b class='flag-5'>芯</b>昇安全MCU芯片通过开源鸿蒙生态认证

    铠装铝电缆的符号和用途详解

    铠装铝电缆的符号和用途详解如下: 一、符号详解 铠装铝电缆的型号通常由多个部分组成,每个部分代表不同的含义。以下是一些常见的符号及其解释: YJ:表示采用交联聚乙烯绝缘材料。交联聚
    的头像 发表于 01-13 10:20 4138次阅读

    屏蔽双绞线的绞方式分类

    屏蔽双绞线的绞方式主要涉及到线的排列与绞程度,以下是关于屏蔽双绞线绞方式的详细解释: 一、绞方式的分类 屏蔽双绞线的绞
    的头像 发表于 01-08 10:34 1018次阅读

    Air8000工业引擎:多IO多功能,即将量产

    科技近日宣布,其工业引擎Air8000即将进入量产阶段。这款引擎集成了4G、Wi-Fi、BLE、GNSS、Gsensor及电源管理等多项功能,专为工业应用而设计,展现了强大的场景解决能力
    的头像 发表于 01-07 14:56 2900次阅读

    昇参与5G发展大会介绍5G-A蜂窝无源物联网芯片开发进展

    进行了广泛探讨,昇科技有限公司(以下简称中昇)通信事业部总经理杨龙波发表了题为《动力开启无源物联网新时代》的主旨演讲。杨龙波首先向各位参会嘉宾介绍了中
    的头像 发表于 12-16 18:07 1642次阅读
    中<b class='flag-5'>移</b><b class='flag-5'>芯</b>昇参与5G发展大会介绍5G-A蜂窝无源物联网芯片开发进展