0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何分析

合宙LuatOS 2024-07-19 15:37 次阅读

Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何分析

简介

本文档适用于合宙Air780E、Air780EP、Air780EQ、Air201

关联文档和使用工具:

Ramdump里分析内存泄漏问题

无法抓底层log的情况下如何导出死机dump

Luatools下载调试工具

EPAT抓取底层日志

Flashtools_v4.1.9下载

luatools和EPAT这2个工具,具体使用方法要了解,本文不做深入讲解,EPAT抓取底层日志文档内有详细使用说明

luatools用于捕获从USB口的用户log,即luat_debug_print输出的log,仅用于csdk和luatos。AT版本没有用户log和用户串口通道,需要使用EPAT工具抓取。

EPAT用于捕获USB口,UART0(DBG_UART串口) 的底层log,在luatools没有开启的时候,EPAT同样捕获用户log的大部分内容,这个时候用户log会从底层log输出,标识为luatos,等级为error,所以不要把用户log当做error!

luatools捕获用户log时,自动识别GB2312还是UTF8编码,也能正确打印64bit数据和浮点数据

EPAT只能识别GB2312编码,不能正确打印64bit和浮点数据,在用UART0捕获数据时会丢失部分log,尤其是优先级低的,所以用户log的等级是error,优先级高

双方都是USB口对接的情况下,USB虚拟串口没有波特率限制,任意选择,实际传输速率都是一样的

为啥要区分用户log通道和底层log通道,因为移芯不开放底层log解析方法

csdk固件默认死机后存储死机信息到flash后重启,luatos固件死机后会存储死机信息到flash,然后等EPAT或者luatools抓取死机信息,等待大约40秒左右会重启

出现死机问题分析

A 怎么抓LOG

A1 认识USB虚拟串口

由于电脑识别出来串口名字都是一样的,因此需要从串口属性上来区分对应功能,具体看下面截图红框

A1.1 用户log通道

wKgZomaaFwWASNeYAACrVioBmcQ761.png

A1.2 底层log通道

wKgZomaaFw2AFVo4AACqCeVAnSI621.png

A1.3 用户串口通道

wKgaomaaFxWAbyycAACpqmi_dsg684.png

A2 抓log

如果使用EPAT工具抓取日志,说明请看 EPAT抓取底层日志文档

A2.1 USB可用

建议方案1,只用luatools勾选USB打印模式即可,没有配置上的要求,luatools会自动识别log通道,需底层log的,工具配置--》log--》勾选ap log,luatools会自动识别log通道,底层log保存在log/4gdiag。luatools版本必须在2.2.1及以上

建议方案2,直接用EPAT,按照EPAT手册操作即可,如果luatools开着,工具配置--》log--》不要勾选ap log

A2.2 USB不可用

只能用EPAT通过DBG_UART抓LOG了,需要6M波特率抓取(USB转TTL工具也要支持6M波特率),如果是AT版本还需要通过发送以下指令配置

AT+ECPCFG=logCtrl,2 // 输出全部日志 AT+ECPCFG=logPortSel,1 // 只从DBG_UART串口输出日志 AT+ECPCFG=logBaudrate,6000000 // 设置波特率为6M


B 遇到死机怎么办

设置死机不重启方法

  • AT固件:发送 AT+ECPCFG="faultAction",0 或者 AT*EXASSERT=1 指令开启死机不重启。
  • LuatOS开发:调用 mcu.hardfault(0) 接口开启死机不重启。
  • CSDK开发:在task中执行 luat_debug_set_fault_mode(LUAT_DEBUG_FAULT_HANG); 开启死机不重启。

B1 EPAT抓底层log,固件设置成死机不重启

EPAT会自动抓,并且自动弹出ramdump处理界面,按照手册操作即可。

B2 luatools抓底层log,固件设置成死机不重启

luatools也会自动抓ramdump,但是只能保存成文件,仍然需要用EPAT来手动进入处理ramdump界面,后续处理见B1

B3 固件设置成死机重启,或者没有工具抓底层log

帮助文档:无法抓底层log的情况下如何导出死机dump


C 死机重启原因常见情况分析

死机需要底层log和ramdump处理结果综合判断,luatos固件还要看用户log,这里讨论如何定位出错代码位置或者出错原因

C1 luavm抛出的异常

这个看用户log就行,如果开启了errdump,还能在iot平台上看到

C2 断言死机

看底层log就可以,搜索EcAssert字样,可以看到断言的位置

如果没有底层log,ramdump里需要看list source的代码上下是不是调用了ec_assert_regs,然后在stackframe with local里看看调用顺序,大概率能看到断言的位置。

断言死机如果是malloc失败,那么就是ram不足了。

C3 内存不足

这是最常见的死机原因,而且9成9可以判断是内存泄露,剩下也有可能malloc时的参数不对,申请了不可能申请到的空间大小。内存不足直接表现,C2中已有部分描述,如果有底层log,还可以从死机时打印的信息来判断

wKgaomaaFyGAE7sjAAMkNBsNIV0748.png

这里表示动态分配ram时,最大的block只有712字节了,这是非常典型的内存不足引起的死机,正常来说,至少要有个70KB左右的空间来满足LTE协议栈的需求

如果ramdump信息完整,则可以从ramdump里找到查找方向从Ramdump里分析内存泄露问题

C4 看门狗死机

在底层log和ramdump里都能看到,

wKgZomaaFymAQeTOAAC0ATfKQoM742.png

ramdump里能看到最后停在NMI Handler里。

看门狗死机,要么死循环,要么操作时间太长,消除死循环,或者主动喂一下狗。压力测试和RSA运算时特别注意一下。

C5 疑难杂症

真正遇到hardfault时,需要先从底层日志里看死机的直接原因,也就是arm内核遇到的致命错误,当然多种多样,常见的地址错误(常见data access)有数据存取时的总线错误(常见precise data access,imprecise data access等等),指令错误(常见switch to an invalid state (e.g., ARM))等等。

以下个人经验:

先要排除一下栈溢出的可能,一旦栈溢出,什么奇怪的现象都有可能发生,运气好的,触发断言,运气不好的,就什么错误都可能发生,任务链表都可能被破坏,导致ramdump里的信息都会缺失。

如果ramdump信息完整,则可以从ramdump大致分析出有没有栈溢出现象从Ramdump里看栈溢出

如果ramdump的信息看起来完整,stackframe with local里调用顺序也比较合理,那么就能定位发生问题的函数和语句,后续就看代码调试吧,这是比较理想的情况。

地址错误的,大概率是读写了一个不可读写的地址,但是注意,有时候非ram和flash地址,直接读取并不一定会出错。

总线错误,大概率是数据对齐的问题,比如uint32_t *指针,去读取一个uint8_t *指针指向的内容,一旦uint8_t *指针存放的地址不是32位对齐的,编译器又没有对应优化处理,死机是很正常的

指令错误,这种常见的函数指针用出问题,导致函数退出时,PC指针已经不能指向正确的代码指令,从而执行了非arm的指令

如果ramdump的信息都不完整,底层log也丢完,或者压根没法抓,建议通过删减代码,加打印语句等方法来定位出错的语句,多次尝试缩小范围,直到成功,有经验,对源码了解的,能加快这一进度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2678

    浏览量

    47370
  • 虚拟串口
    +关注

    关注

    3

    文章

    62

    浏览量

    13866
  • 合宙通信
    +关注

    关注

    0

    文章

    147

    浏览量

    1730
收藏 人收藏

    评论

    相关推荐

    合宙Air780EP模块Lua开发阿里云应用指南

    合宙Air780EP模块Lua开发阿里云超详细教学!看完包学会!
    的头像 发表于 08-08 09:00 883次阅读
    合宙<b class='flag-5'>Air780EP</b><b class='flag-5'>模块</b>Lua开发阿里云应用指南

    MQTT应用看这篇!合宙Air780EP_LuatOS_MQTT应用指南

    Air780EP 是合宙的低功耗4G模组之一,支持LuatOS的脚本二次开发,即使是不太懂技术的老板,也能轻松使用 Air780EP开发产品。 本文应各位大佬邀请,详细讲解了Air780EP 的MQTT的应用教程!
    的头像 发表于 08-08 17:13 1781次阅读
    MQTT应用看这篇!合宙<b class='flag-5'>Air780EP</b>_LuatOS_MQTT应用指南

    合宙低功耗4G模组Air780EQ——硬件设计手册01

    合宙低功耗4G模组Air780EQ的硬件设计介绍
    的头像 发表于 08-29 18:15 2099次阅读
    合宙低功耗4G模组<b class='flag-5'>Air780EQ</b>——硬件设计手册01

    FTP应用看这篇!合宙Air780EP低功耗4G模组AT开发示例

    适用于以下型号: Air700ECQ/Air700EAQ/Air700EMQ Air780EQ/Air780EPA/
    的头像 发表于 09-29 09:36 1770次阅读
    FTP应用看这篇!合宙<b class='flag-5'>Air780EP</b>低功耗4G模组AT开发示例

    【合宙Air780E开发板趣味应用】Air780E开发板方言打麻将

    合宙10月份推出的Air780E模组,是一款LTE Cat.1 bis通信模块,采用移芯EC618平台,支持4G全网通。合宙也推出了相应的开发板,别看开发板身材小,价格低,但是身手不差。合宙
    发表于 01-04 13:45

    Air780E硬件设计手册

    电子发烧友网站提供《Air780E硬件设计手册.pdf》资料免费下载
    发表于 04-14 09:57 20次下载

    Air780E/Air780EP/Air780EQ/Air201模块遇到内存死机如何分析

    Air780E/Air780EP/Air780EQ/Air201模块遇到内存
    的头像 发表于 07-19 16:07 496次阅读
    <b class='flag-5'>Air780E</b>/<b class='flag-5'>Air780EP</b>/<b class='flag-5'>Air780EQ</b>/<b class='flag-5'>Air201</b><b class='flag-5'>模块</b><b class='flag-5'>遇到</b>内存<b class='flag-5'>死机</b>如何<b class='flag-5'>分析</b>

    Air780EP模块AT开发-HTTP应用指南

    Air780EP模块AT开发-HTTP应用指南
    的头像 发表于 07-22 14:38 586次阅读
    <b class='flag-5'>Air780EP</b><b class='flag-5'>模块</b>AT开发-HTTP应用指南

    合宙 Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何分析

    Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何
    的头像 发表于 08-01 17:27 723次阅读
    合宙 <b class='flag-5'>Air780E</b>/<b class='flag-5'>Air780EP</b>/<b class='flag-5'>Air780EQ</b>/<b class='flag-5'>Air201</b><b class='flag-5'>模块</b><b class='flag-5'>遇到死机</b>问题如何<b class='flag-5'>分析</b>

    Air780EP模块FTP应用AT开发详解

    基于合宙Air780EP使用AT指令接入FTP的超详细教程!
    的头像 发表于 08-21 11:16 486次阅读
    <b class='flag-5'>Air780EP</b><b class='flag-5'>模块</b>FTP应用AT开发详解

    合宙LuatOS产品规格书——Air780EQ

    合宙LuatOS——低功耗4G模组——产品规格书——Air780EQ
    的头像 发表于 08-29 14:37 442次阅读
    合宙LuatOS产品规格书——<b class='flag-5'>Air780EQ</b>

    合宙Air780E硬件设计手册02

    合宙低功耗4G模组Air780E硬件设计介绍
    的头像 发表于 09-06 12:02 418次阅读
    合宙<b class='flag-5'>Air780E</b>硬件设计手册02

    基站定位与Wi-Fi定位看这篇!合宙Air780EP低功耗4G模组AT开发示例

    同样适用于以下型号: Air700ECQ/Air700EAQ/Air700EMQ Air780EQ/Air780EPS/
    的头像 发表于 09-25 07:26 449次阅读
    基站定位与Wi-Fi定位看这篇!合宙<b class='flag-5'>Air780EP</b>低功耗4G模组AT开发示例

    RNDIS网卡应用看这篇!合宙Air780EP低功耗4G模组AT开发示例

    型号: Air700ECQ/Air700EAQ/Air700EMQ Air780EQ/Air780EPS/
    的头像 发表于 09-30 06:59 500次阅读
    RNDIS网卡应用看这篇!合宙<b class='flag-5'>Air780EP</b>低功耗4G模组AT开发示例

    UDP应用详解:Air780E软件的全面手册

    了解Air780E软件UDP应用全面手册,永享编程幸福人生。
    的头像 发表于 11-05 12:31 160次阅读
    UDP应用详解:<b class='flag-5'>Air780E</b>软件的全面手册