0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arthas可以解决哪些问题

电子设计 来源:电子设计 作者:电子设计 2020-12-24 14:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

转载本文需注明出处:微信公众号EAWorld,违者必究。

什么是Arthas

Java 诊断利器 Arthas,是阿里的一款开源工具。Github-alibaba/arthas 上可以看到它的介绍。

在日常开发中,当我们发现应用的某个接口响应比较慢,这个时候想想要分析一下原因,找到代码中耗时的部分,比较容易想到的是在接口链路的 IO 操作上下游打印时间日志,再根据几个时间点的日志算出耗时长的 IO 操作。这种方式没有问题,但是加日志需要发布,既繁琐又低效,这个时候可以引入一些线上 debug 的工具,arthas 就是很好的一种,除了分析耗时,还可以打印调用栈、方法入参及返回,类加载情况,线程池状态,系统参数等等,其实现原理是解析 JVM 在操作系统中的文件,大部分操作是只读的,对服务进程没有侵入性,因此可以放心使用。

Arthas能解决什么问题?

从我个人的使用经验来看,Arthas至少帮我解决了以下几个问题:

监控某方法查看其整个调用链路,从而找出某次调用的性能瓶颈。

反编译某个类,查看线上的代码是否与本地代码一致,避免没有提交代码而导致的问题。

站在全局视角查看整个系统的运行情况,比如观察内存增长、GC的情况。

在微服务架构背景下,通常本地没有完整的环境,此时可以直接在测试环境监控某个方法传入的参数是否正确,返回值是否正确。

快速开始

下载并启动arthas

输入以下命令启动arthas程序

curl -O https://arthas.aliyun.com/arthas-demo.jarjava -jar arthas-demo.jar

选择需要监控应用的进程编号,回车后Arthas会attach到目标进程上,并输出日志:

容器中使用

docker exec -it arthas-demo /bin/sh -c "java -jar /opt/arthas/arthas-boot.jar"

甚至我们可以直接把arthas放到容器镜像文件中:

COPY --from=hengyunabc/arthas:latest /opt/arthas /opt/arthas

Arthas常用命令

下面简要为大家介绍一下Arthas常用的几个命令。

dashboard

使用dashboard命令会显示以下信息:

1. 当前最繁忙的一些线程

2. 显示应用当前使用的内存信息,包括堆内存、新生代伊甸区、老年代、非堆内存的使用情况。

3. 显示程序的GC情况,包括YGC次数、总花费时间,FGC的次数、总花费时间。

4. 当前程序的一些信息,包括系统版本、JDK版本、程序运行时长等。

Thread

查看当前线程信息,查看线程的堆栈

// 查看 CPU 使用率 top n 的线程的栈,当前最忙的前 n 个线程:thread -n 3// 查看 5 秒内的 CPU 使用率 top n 的线程栈:thread -n 3 -i 5000

// 查看线程是否有阻塞:thread -b

watch

有时候我们不太方便进行本地调试,这个时候可以使用watch监控某个方法,然后点击相关的功能,查看该方法的调用情况:

watch com.primeton.dgp.assets.controller.DsResourcePoolController getResourcePool "{params,returnObj}" -x 2

执行以上命令后,控制台会hold在被监控的方法上,此时再次点击页面上的按钮,控制台就会打印此次的调用结果。

trace

trace 命令能主动搜索 class-pattern/method-pattern 对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路。通常我们用这个方法可以看到整个调用路径的耗时,从而找出真正的性能瓶颈,帮助解决问题。

trace com.primeton.dgp.assets.controller.DsResourcePoolController getResourcePool

tt

tt方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测,使用方法如下:

tt -t com.primeton.dgp.assets.controller.DsResourcePoolController getResourcePool

执行此命令后,arthas会记录下指定方法的每次调用环境现场,并打印一些相关的信息,如调用时长、是否正常返回、是否抛出异常等。

显示所有被记录的调用列表

tt -l

重做一次调用。tt 命令由于保存了当时调用的所有现场信息,所以我们可以自己主动对一个 INDEX 编号的时间片自主发起一次调用,从而解放你的沟通成本。此时你需要 -p 参数。通过 --replay-times 指定 调用次数,通过 --replay-interval 指定多次调用间隔(单位ms, 默认1000ms)

tt -i 1001 -p --replay-times 3 --replay-interval 3000

jad

jad 命令将 JVM 中实际运行的 class 的 byte code 反编译成 java 代码,便于你理解业务逻辑;反编译出来的源码是带语法高亮的,阅读更方便。当我们看到某个方法的调用时长明显过长,或者时空隧道中某方法抛出异常,这个时候就可以直接反编译相关的方法,看看是否能找出原因。

其他

除了以上很常用的命令以外,arthas还有很多实用命令,大家可以参考官方文档来使用

另外,每一个命令都支持-help参数,可以查看该命令的说明、参数,甚至包括了使用例子,可以说是非常贴心了

案例

案例1

我们准备了一个简单的springboot应用,应用内有一个Controller,返回一个字符串,代码如下:

@RestControllerpublic class DemoController {

@GetMapping(value = "/getDemo")public String getDemo(){return "demo 1"; }}

启动程序,访问刚刚准备好的controller得到了下面的结果

接下来我们要尝试在没有源码的情况下修改demo controller的返回值,并在不重启应用的情况下,使我们修改的返回值生效。

首先启动arthas并织入到刚才的demo,然后反编译DemoController到临时文件夹。

jad --source-only com.example.arthas.DemoController > /tmp/DemoController.java

接下来我们用vim修改反编译出来的代码

查询加载原有DemoController类的ClassLoader

sc -d com.example.arthas.DemoController

重新编译修改后的类

mc -c 685f4c2e /tmp/DemoController.java

重新加载修改后的类

redefine -c 685f4c2e /opt/arthas/demo/com/example/arthas/DemoController.class

此时,无需重启应用,我们重新访问刚才的controller,会发现返回结果已经成功更改了。

案例2

某燃气系统由于被众多地区的燃气公司所使用,所以版本繁多,经历过很多轮的测试,其中比较耗时的当属性能测试了。以往性能测试工作通常耗时很长,主要是性能测试人员并不一定熟悉项目代码,导致压力测试出现问题的时候不容易找到问题的所在。

在本次的表具接口的性能测试中,我们使用Arthas工具进行故障的快速定位,大幅减少了性能测试的时间,达到了很好的效果。

本次压力测试的过程中我们发现,当并发达到一定数量的时候系统会卡死,大量新的请求会超时。使用dashboard查看发现系统的大量线程处于block或者wating中。

使用trace命令,将压力测试的方法进行监控,并保存到日志文件中,接着重新跑一轮压力测试。

trace -n 150000 com.towngas.tcis.interfaces.nb.NbInfoServlet getService >> tt-2020-10-17-NbServlet-getService

监控日志,当用户数达到500+的时候果然发现了问题

继续使用trace命令跟踪,发现了可能出现问题的方法

使用jad命令反编译该代码可以看到HttpClient并没有被立即关闭,使用release的释放后关闭通常没有问题,但是释放资源有一个过程通常是180秒,所以如果短时间有大量接口调用,会导致打开的socket连接数量超过系统设定值。找到原因后问题得以顺利解决,压力测试得以顺利完成。

小结

本次的分享为大家介绍了Arthas的基本概念与基础的使用方法。更为详细的使用方法、命令的更多参数,还请查看Arthas的官方文档。

关于作者:李云涛,普元高级开发工程师,擅长性能调优、微服务、容器、消息队列等技术。先后参与邮储银行Java开发平台、中移总ERP流程平台、中煤信息技术中台等平台的的架构设计与平台研发工作。

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4940

    浏览量

    73119
  • 编译
    +关注

    关注

    0

    文章

    687

    浏览量

    34937
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    远心镜头可以调倍率吗?

    也有一些例外。比如东莞锐星视觉技术提供了双远心镜头,还有三倍率/双倍率双远心镜头。这些镜头在保留远心特性的基础上,让同一个镜头可以更换两种倍率,也就是可以根据具体需
    的头像 发表于 12-03 17:22 43次阅读
    远心镜头<b class='flag-5'>可以</b>调倍率吗?

    哪些电容可以替代CBB81电容

    CBB81电容属于高压谐振薄膜电容器,主要用于高压、高频、大电流电路中,事实上,有很多电容器的作用和CBB81电容是一样的,可以互相替代,cbb81电容用什么可以代替?
    的头像 发表于 08-26 14:23 915次阅读

    科普|高通量卫星可以用来打电话吗?

    在应急指挥环境下,卫星资源的应用是必须的,当地面运营商基站遭到破坏时,利用卫星仍然可以实现应急的通信。一般应急现场可以使用卫星电话设备进行电话沟通,卫星电话的使用方法与普通电话也没有什么差别,只需要
    的头像 发表于 08-18 18:12 650次阅读
    科普|高通量卫星<b class='flag-5'>可以</b>用来打电话吗?

    工业组态云平台可以实现哪些功能

    工业组态云平台可以实现数据采集与监控、报警通知、远程控制与运维、数据分析与决策、组态设计与可视化等多种功能,以下是具体介绍: 1、数据采集与监控 实时数据采集:通过内置多种工业设备驱动,支持主流
    的头像 发表于 08-18 14:36 280次阅读

    网线可以串联吗?为什么

    网线可以串联,但通常不建议这样做,尤其在需要稳定高速网络连接的场景中。 以下是具体分析: 一、网线串联的可行性 从技术层面看,网线(如常见的超五类、六类网线)可以通过以下方式串联: 直接对接 将两根
    的头像 发表于 08-06 10:14 1825次阅读

    干扰可以提高测量精度,是真的吗?

    一、前言 水可以引燃蜡烛,是真的吗?是真的! 蛇怕雄黄,是真的吗?是假的! 上述两个现象,已经由央视 财经频道《是真的吗?》揭秘。 今天要探讨的是: 干扰可以提高测量精度,是真的吗? 通常情况下
    的头像 发表于 08-04 09:28 531次阅读
    干扰<b class='flag-5'>可以</b>提高测量精度,是真的吗?

    光纤跳线可以弯曲吗

    光纤跳线可以弯曲,但弯曲程度必须控制在合理范围内,过度弯曲会导致信号衰减增加、传输性能下降甚至光纤损坏。以下是详细解释: 一、光纤跳线为何能弯曲? 光纤跳线由光纤和保护层组成,光纤本身是柔性的玻璃或
    的头像 发表于 07-25 10:17 595次阅读

    一片主板可以有多少路CPU?

    CPU是计算机的中央处理器,可以直接影响到服务器的并行处理能力。CPU路数越多,服务器可以同时处理的任务数量就越多,从而提高了整体的处理效率和性能,特别是在处理大量并发任务时,多路服务器具有明显优势‌。
    的头像 发表于 06-13 09:14 528次阅读
    一片主板<b class='flag-5'>可以</b>有多少路CPU?

    门铃语音芯片有哪几种型号可以选择?

    门铃语音芯片的选择可以很广泛!因为简单的OTP语音芯片也可以用,高级一点的FLASH语音芯片,或者在高端一点的语音识别芯片,或者集成蓝牙又或者红外等等,有非常多的方案,具体可以看自己详细的需求。 以
    的头像 发表于 06-09 15:58 532次阅读

    智能IC卡可以做什么工艺呢?

    1、IC卡可以根据客户提供的素材进行版面设计,也可由客户提供设计稿2、IC卡的厚度从0.5mm到2mm,一般国际标准厚度0.84MM3、IC卡的标准大小是85.5mmX54mm,圆角104、IC卡
    的头像 发表于 04-01 14:51 660次阅读
    智能IC卡<b class='flag-5'>可以</b>做什么工艺呢?

    异形拼接处理器可以实现的效果

    异形拼接处理器可以实现的效果非常多样化和创新,以下是对其可实现效果的进一步补充: 一、创意拼接显示 1、任意角度拼接:异形拼接处理器支持0~360度任意角度的拼接显示,使得显示屏可以以各种角度进行
    的头像 发表于 03-21 12:39 509次阅读
    异形拼接处理器<b class='flag-5'>可以</b>实现的效果

    光谱传感器可以做什么

    光谱传感器是一种能够检测多种颜色和光谱信息的传感器,通过测量物体的光谱特征,可以实现对物体的颜色、成分等属性的准确判断。以下是对光谱传感器具体应用的详细介绍:
    的头像 发表于 01-27 14:19 1264次阅读

    量子芯片可以代替硅芯片吗

    量子芯片与硅芯片在技术和应用上存在显著差异,因此量子芯片是否可以完全代替硅芯片是一个复杂的问题。以下是对这一问题的详细分析:
    的头像 发表于 01-27 13:53 1703次阅读

    GitHub Copilot 可以免费使用了!

    “  这个标题有点标题党,虽然 Github Copilot 确实是可以免费使用,但这个免费是有限制的,聊天互动每月限制50次,代码补全(或者建议)每月2000次。不过这个 Copiot 真的是很好
    的头像 发表于 12-22 11:19 4270次阅读
    GitHub Copilot <b class='flag-5'>可以</b>免费使用了!

    数组的下标为什么可以是负数

    最近有同学发来这样一段代码,并提出一个问题,数组的下标为什么可以是负数?     #include int main(){ const char *s = "helloworld"; const
    的头像 发表于 12-20 11:18 851次阅读