0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

接口响应慢该如何排查 接口慢的排查思路

马哥Linux运维 来源:马哥Linux运维 2023-08-07 10:03 次阅读

不知道大家有没有遇到这种情况,接口业务逻辑写完后,用 postman 一调,发现接口响应时间好长,不得不对接口进行优化。

但是此时接口的代码往往逻辑比较复杂,调用层次也比较多,很难定位到耗时较长的代码块

遇到这种情况大家都是如何定位耗时代码块的呢?

我看到很多人都是直接用System.currentTimeMillis()对代码进行埋点

publicstaticvoidmain(String[]args){
LongstartTime=System.currentTimeMillis();
exec();
LongendTime=System.currentTimeMillis();
log.info("exec方法执行耗时:{}ms",endTime-startTime);
}

或者用StopWatch打印方法耗时

publicstaticvoidmain(String[]args)throwsInterruptedException{
StopWatchstopWatch=newStopWatch();
stopWatch.start("exec");
exec();
stopWatch.stop();
System.out.println(stopWatch.prettyPrint());
}

这两种方法本质上是一样的,都是通过手动在代码块上进行埋点,打印出方法的耗时,该方法不仅费时费力,而且对代码有侵入,修复问题后删掉代码还是一个麻烦事

下面介绍如果通过Arthas定位耗时代码块

Arthas 简介

Arthas是阿里开源的一款 Java 诊断工具,可以在无需重启 JVM 的情况下,实时查看应用 load、内存、gc、线程等状态信息,还能实时查看方法调用入参、出参、方法调用耗时等

Arthas 快速开始

直接下载Arthasjar 包,然后用java -jar命令启动即可

$curl-Ohttps://arthas.aliyun.com/arthas-boot.jar
$java-jararthas-boot.jar

Arthas启动的时候,会打印出当前运行的 java 进程

$java-jararthas-boot.jar
[INFO]JAVA_HOME:/Library/Java/JavaVirtualMachines/jdk1.8.0_351.jdk/Contents/Home/jre
[INFO]arthas-bootversion:3.6.9
[INFO]Foundexistingjavaprocess,pleasechooseoneandinputtheserialnumberoftheprocess,eg:1.ThenhitENTER.
*[1]:12512com.huangxy.springstudy.SpringStudyApplication
[2]:12511org.jetbrains.jps.cmdline.Launcher

然后可以选择我们需要 attach 的 java 进程,这里我们选择 1,然后按回车。Arthas 会 attach 到目标进程上,并输出日志:

[INFO]arthashome:/Users/huangxiaoyu/.arthas/lib/3.6.9/arthas
[INFO]Trytoattachprocess12512
[INFO]Attachprocess12512success.
[INFO]arthas-clientconnect127.0.0.13658
,---.,------.,--------.,--.,--.,---.,---.
/O|.--.''--..--'|'--'|/O'.-'
|.-.||'--'.'|||.--.||.-.|`.`-.
||||||||||||||||.-'|
`--'`--'`--''--'`--'`--'`--'`--'`--'`-----'

wikihttps://arthas.aliyun.com/doc
tutorialshttps://arthas.aliyun.com/doc/arthas-tutorials.html
version3.6.9
main_classcom.huangxy.springstudy.SpringStudyApplication
pid12512
time2023-07-2509:14:22

到这里,Arthas 已经 attach 到我们的目标进程上了,我们尝试使用dashboad命令,查看进程的信息

$dashboard
IDNAMEGROUPPRIORITYSTATE%CPUDELTA_TIMETIMEINTERRUPTDAEMON
36DestroyJavaVMmain5RUNNABLE0.00.0000:1.748falsefalse
-1C1CompilerThread3--1-0.00.0000:0.761falsetrue
-1VMPeriodicTaskThread--1-0.00.0000:0.237falsetrue
24http-nio-8081-exec-1main5WAITING0.00.0000:0.098falsetrue
-1VMThread--1-0.00.0000:0.071falsetrue
25http-nio-8081-exec-2main5WAITING0.00.0000:0.055falsetrue
54arthas-NettyHttpTelnetBootstrasystem5RUNNABLE0.00.0000:0.054falsetrue
-1GCtaskthread#8(ParallelGC)--1-0.00.0000:0.043falsetrue
-1GCtaskthread#1(ParallelGC)--1-0.00.0000:0.043falsetrue
-1GCtaskthread#7(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#6(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#0(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#9(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#2(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#3(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#5(ParallelGC)--1-0.00.0000:0.042falsetrue
-1GCtaskthread#4(ParallelGC)--1-0.00.0000:0.042falsetrue
MemoryusedtotalmaxusageGC
heap83M432M7282M1.14%gc.ps_scavenge.count4
ps_eden_space72M212M2688M2.69%gc.ps_scavenge.time(ms)24
ps_survivor_space0K21504K21504K0.00%gc.ps_marksweep.count2
ps_old_gen10M199M5461M0.20%gc.ps_marksweep.time(ms)61
nonheap53M56M-194.71%
code_cache6M7M240M2.87%
metaspace40M43M-194.45%
compressed_class_space5M5M1024M0.53%
direct16K16K-100.01%
mapped0K0K-0.00%
Runtime
os.nameMacOSX
os.version13.0.1
java.version1.8.0_351
java.home/Library/Java/JavaVirtualMachines/jdk1.8.0_351.jdk/Contents/
Home/jre
systemload.average3.80
processors12

可以看到dashboad命令会展示一个实时的数据面板,列出了我们平时比较关心的数据指标,如内存使用量,gc 状态等

更多命令的使用,可以参考官网的命令列表

使用 Trace 命令统计方法耗时

trace命令能主动搜索class-pattern/method-pattern对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路

比如下面接口

@RestController
publicclassHelloController{

@GetMapping("/test")
publicStringtest()throwsInterruptedException{
one();
two();
return"hello";
}

privatevoidtwo()throwsInterruptedException{
Thread.sleep(20);
three();
}

privatevoidthree()throwsInterruptedException{
Thread.sleep(1000);
}

privatevoidone()throwsInterruptedException{
Thread.sleep(100);
}

}

启动Arthas进程,并 attach 到我们的 springboot 项目上,接着使用trace命令跟踪方法的调用情况

$tracecom.huangxy.springstudy.controller.HelloControllertest

trace方法第一个参数是要 attach 的类的路径,第二个参数是方法名称,接着我们调用一遍接口,就能看到 hello 方法的调用堆栈及其耗时

7023eaec-3457-11ee-9e74-dac502259ad0.png

可以看到,这里耗时比较严重的是tow()方法,花了 1029ms,占了 90.73% 的比重

不过需要注意的是,trace 命令只会 trace 匹配到的函数里的子调用,并不会向下 trace 多层,如果需要 trace 多层,可以用正则匹配多个函数,如

$trace-E com.huangxy.springstudy.controller.HelloControllertest|two
702d9506-3457-11ee-9e74-dac502259ad0.pngimage.png

这下更清晰的定位到,导致耗时过长的方法是three()方法,定位到方法后,针对性的优化耗时代码块即可







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • JAVA语言
    +关注

    关注

    0

    文章

    138

    浏览量

    19946
  • JVM
    JVM
    +关注

    关注

    0

    文章

    152

    浏览量

    12130

原文标题:接口响应慢该如何排查

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    运放输出响应怎么回事?

    本帖最后由 gk320830 于 2015-3-5 22:25 编辑 用运放驱动电机,但输出响应有点怎么回事,可以怎么改进?谢谢!输出电路,OUT接电机输出电流小于3A。输出延时是蛮长的,请给点改进的建议,谢谢!
    发表于 04-18 19:56

    GPIB接口仪器控制中数据波形更新速度问题

    有哪些同学以前做过用GPIB接口控制频谱仪的,有个问题请教大家,我的程序能实现控制及波形显示,但波形刷新率比仪器单独测量时好多,我认为有可能是GPIB接口的传输速率偏低,导致从仪器读取一次数据的时间过多,所以波形数据更新
    发表于 12-15 08:48

    基于分布式调用链监控技术的全息排查功能

    解决问题的核心思路是将用户的业务内容 (简称BizID) 和相关调用链的TraceID做关联,来支持通过业务属性来查询对应的问题调用链。以下简单介绍如何上手ARMS全息排查功能。其操作的基本场景架构如下
    发表于 08-07 17:02

    Flink Checkpoint 问题排查实用指南

    Checkpoint 失败,或者 Checkpoint 的情况,本文会统一聊一聊Flink 中 Checkpoint 异常的情况(包括失败和),以及可能的原因和排查思路。1. C
    发表于 09-17 16:25

    Flink on YARN(下):常见问题与排查思路

    : org.apache.flink.yarn.cli.FlinkYarnSessionCli@25ce9dc4Flink Cluster 常见问题与排查思路▼ 用户应用和框架 JAR 包版本冲突问题问题通常会抛出
    发表于 10-10 14:14

    Flink on YARN(下):常见问题与排查思路

    客户端和 Flink Cluster 的常见问题,分享相关问题的排查思路。客户端常见问题与排查思路▼ 应用提交控制台异常信息:Could not build the program f
    发表于 10-14 15:04

    i.MX6ULL——ElfBoard 的ELF1 板卡网口不通问题排查思路

    的,那么对于网口,经常出现的问题就是网口不通,所以网口问题的排查是工程师理应具备的基本素质。 网口问题排查思路 在遇到网口问题时排查网口问题首先要明确问题点,网口不通的情况下首先要看
    发表于 10-21 10:44

    i.MX6ULL——ElfBoard 的ELF1 板卡网口不通问题排查思路

    的,那么对于网口,经常出现的问题就是网口不通,所以网口问题的排查是工程师理应具备的基本素质。 网口问题排查思路 在遇到网口问题时排查网口问题首先要明确问题点,网口不通的情况下首先要看
    发表于 10-21 14:11

    i.MX6ULL--ElfBoard 音频接口介绍及音频接口问题排查思路

    式插针)标准耳机,会有放音和录音功能失效的现象。 音频 接口问题排查思路 (1)首先检查焊接器件是否与设计的底板的原理图一致,音频芯片是否使用同一型号,电阻电容对应;阻值容值如有改动是否会有影响; (2
    发表于 10-25 13:38

    AD7708转换结果时而正常,有时候变得特别的原因?怎么排查

    有两台样机使用AD7708,相同程序,一台正常。另一台AD转换速度有时候正常,有时候特别满。用示波器查看ready引脚信号,也能发现输出波形也很慢。 重新焊接了,也没啥问题。请问这种情况应该怎么排查问题。谢谢。
    发表于 12-04 06:04

    建立一个方法和套路来对 Load 高问题排查

    讲解 Linux Load 高如何排查的话题属于老生常谈了,但多数文章只是聚焦了几个点,缺少整体排查思路的介绍。所谓 “授人以鱼不如授人以渔"。本文试图建立一个方法和套路,来帮助读者对 Load 高问题
    的头像 发表于 12-28 14:18 5080次阅读
    建立一个方法和套路来对 Load 高问题<b class='flag-5'>排查</b>

    排查矩阵按键丢键问题

    背景按键板作为用户交互入口、板载LCD,与主板通过串口通讯。接手别人留下的代码,发现存在按键响应不到的问题。问题排查排查方向一:debug调试打断点,发现可以响应按键。
    发表于 12-07 14:21 8次下载
    <b class='flag-5'>排查</b>矩阵按键丢键问题

    在Kubernetes集群发生网络异常时如何排查

    本文将引入一个思路:“在 Kubernetes 集群发生网络异常时如何排查”。文章将引入 Kubernetes 集群中网络排查思路,包含网络异常模型,常用工具,并且提出一些案例以供学
    的头像 发表于 09-02 09:45 3128次阅读

    网络故障排查思路和处理方法

    网络故障是最容易出现的,且难以解决的问题。本文提供的网络故障排查思路和处理方法,可解决日常工作中大部分网络问题。
    发表于 10-31 09:14 7379次阅读

    网络二层环路的排查思路与技巧

    今天浩道跟大家分享一篇关于网络二层环路的排查思路与技巧,希望能够在日常工作中帮助到你,得到老板的鸡腿大餐!
    的头像 发表于 12-29 15:38 3080次阅读