0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

K8S集群服务访问失败怎么办 K8S故障处理集锦

开关电源芯片 来源:博客园 作者:chalon 2021-09-01 11:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

问题1:K8S集群服务访问失败?

原因分析:证书不能被识别,其原因为:自定义证书,过期等。

解决方法:更新证书即可。

问题2:K8S集群服务访问失败?

curl: (7) Failed connect to 10.103.22.158:3000; Connection refused

原因分析:端口映射错误,服务正常工作,但不能提供服务。

解决方法:删除svc,重新映射端口即可。

kubectl delete svc nginx-deployment

问题3:K8S集群服务暴露失败?

Error from server (AlreadyExists): services “nginx-deployment” already exists

原因分析:该容器已暴露服务了。

解决方法:删除svc,重新映射端口即可。

问题4:外网无法访问K8S集群提供的服务?**

原因分析:K8S集群的type为ClusterIP,未将服务暴露至外网。

解决方法:修改K8S集群的type为NodePort即可,于是可通过所有K8S集群节点访问服务。

kubectl edit svc nginx-deployment

问题5:pod状态为ErrImagePull?

readiness-httpget-pod 0/1 ErrImagePull 0 10s

原因分析:image无法拉取;

解决方法:更换镜像即可。

问题6:创建init C容器后,其状态不正常?

NAME READY STATUS RESTARTS AGEmyapp-pod 0/1 Init:0/2 0 20s

原因分析:查看日志发现,pod一直出于初始化中;然后查看pod详细信息,定位pod创建失败的原因为:初始化容器未执行完毕。

Error from server (BadRequest): container “myapp-container” in pod “myapp-pod” is waiting to start: PodInitializing

waiting for myservice

Server: 10.96.0.10Address: 10.96.0.10:53

** server can‘t find myservice.default.svc.cluster.local: NXDOMAIN

*** Can’t find myservice.svc.cluster.local: No answer*** Can‘t find myservice.cluster.local: No answer*** Can’t find myservice.default.svc.cluster.local: No answer*** Can‘t find myservice.svc.cluster.local: No answer*** Can’t find myservice.cluster.local: No answer

解决方法:创建相关service,将SVC的name写入K8S集群的coreDNS服务器中,于是coreDNS就能对POD的initC容器执行过程中的域名解析了。

kubectl apply -f myservice.yaml

70d876ec-fc4b-11eb-9bcf-12bb97331649.png

70e26242-fc4b-11eb-9bcf-12bb97331649.png

70ee8874-fc4b-11eb-9bcf-12bb97331649.png

NAME READY STATUS RESTARTS AGE

myapp-pod 0/1 Init:1/2 0 27mmyapp-pod 0/1 PodInitializing 0 28mmyapp-pod 1/1 Running 0 28m

问题7:探测存活pod状态为CrashLoopBackOff?

原因分析:镜像问题,导致容器重启失败。

解决方法:更换镜像即可。

71883b18-fc4b-11eb-9bcf-12bb97331649.png

问题8:POD创建失败?

readiness-httpget-pod 0/1 Pending 0 0sreadiness-httpget-pod 0/1 Pending 0 0sreadiness-httpget-pod 0/1 ContainerCreating 0 0sreadiness-httpget-pod 0/1 Error 0 2sreadiness-httpget-pod 0/1 Error 1 3sreadiness-httpget-pod 0/1 CrashLoopBackOff 1 4sreadiness-httpget-pod 0/1 Error 2 15sreadiness-httpget-pod 0/1 CrashLoopBackOff 2 26sreadiness-httpget-pod 0/1 Error 3 37sreadiness-httpget-pod 0/1 CrashLoopBackOff 3 52sreadiness-httpget-pod 0/1 Error 4 82s

原因分析:镜像问题导致容器无法启动。

7192887a-fc4b-11eb-9bcf-12bb97331649.png

解决方法:更换镜像。

719d0548-fc4b-11eb-9bcf-12bb97331649.png

71a875cc-fc4b-11eb-9bcf-12bb97331649.png

问题9:POD的ready状态未进入?

readiness-httpget-pod 0/1 Running 0 116s

原因分析:POD的执行命令失败,无法获取资源。

71b21032-fc4b-11eb-9bcf-12bb97331649.png

解决方法:进入容器内部,创建yaml定义的资源

71ca7816-fc4b-11eb-9bcf-12bb97331649.png

71d6c364-fc4b-11eb-9bcf-12bb97331649.png

问题10:pod创建失败?

71f1586e-fc4b-11eb-9bcf-12bb97331649.png

原因分析:yml文件内容出错—-使用中文字符;

解决方法:修改myregistrykey内容即可。

72000364-fc4b-11eb-9bcf-12bb97331649.png

11、kube-flannel-ds-amd64-ndsf7插件pod的status为Init:0/1?

72085e60-fc4b-11eb-9bcf-12bb97331649.png

排查思路:kubectl -n kube-system describe pod kube-flannel-ds-amd64-ndsf7 #查询pod描述信息;

721d19a4-fc4b-11eb-9bcf-12bb97331649.png

原因分析:k8s-slave1节点拉取镜像失败。

解决方法:登录k8s-slave1,重启docker服务,手动拉取镜像。

7234183e-fc4b-11eb-9bcf-12bb97331649.png

k8s-master节点,重新安装插件即可。

kubectl create -f kube-flannel.yml;kubectl get nodes

72452818-fc4b-11eb-9bcf-12bb97331649.png

12、K8S创建服务status为ErrImagePull?

72582602-fc4b-11eb-9bcf-12bb97331649.png

排查思路:

kubectl describe pod test-nginx

72676f0e-fc4b-11eb-9bcf-12bb97331649.png

原因分析:拉取镜像名称问题。

解决方法:删除错误pod;重新拉取镜像;

kubectl delete pod test-nginx;kubectl run test-nginx --image=10.0.0.81:5000/nginx:alpine

13、不能进入指定容器内部?

727a2c48-fc4b-11eb-9bcf-12bb97331649.png

原因分析:yml文件comtainers字段重复,导致该pod没有该容器。

解决方法:去掉yml文件中多余的containers字段,重新生成pod。

7285b040-fc4b-11eb-9bcf-12bb97331649.png

72917b50-fc4b-11eb-9bcf-12bb97331649.png

14、创建PV失败?

729ba01c-fc4b-11eb-9bcf-12bb97331649.png

原因分析:pv的name字段重复。

解决方法:修改pv的name字段即可。

72ae28d6-fc4b-11eb-9bcf-12bb97331649.png

15、pod无法挂载PVC?

72b7bb9e-fc4b-11eb-9bcf-12bb97331649.png

72c0f7d6-fc4b-11eb-9bcf-12bb97331649.png

原因分析:pod无法挂载PVC。

72cbe740-fc4b-11eb-9bcf-12bb97331649.png

73464ae4-fc4b-11eb-9bcf-12bb97331649.png

accessModes与可使用的PV不一致,导致无法挂载PVC,由于只能挂载大于1G且accessModes为RWO的PV,故只能成功创建1个pod,第2个pod一致pending,按序创建时则第3个pod一直未被创建;

解决方法:修改yml文件中accessModes或PV的accessModes即可。

735283a4-fc4b-11eb-9bcf-12bb97331649.png

16、问题:pod使用PV后,无法访问其内容?

73631ee4-fc4b-11eb-9bcf-12bb97331649.png

原因分析:nfs卷中没有文件或权限不对。

73a474fc-fc4b-11eb-9bcf-12bb97331649.png

73af9e86-fc4b-11eb-9bcf-12bb97331649.png

解决方法:在nfs卷中创建文件并授予权限。

73b9d2e8-fc4b-11eb-9bcf-12bb97331649.png

73c25ef4-fc4b-11eb-9bcf-12bb97331649.png

17、查看节点状态失败?

Error from server (NotFound): the server could not find the requested resource (get services http)

原因分析:没有heapster服务。

解决方法:安装promethus监控组件即可。

73cf4e0c-fc4b-11eb-9bcf-12bb97331649.png

74380e9c-fc4b-11eb-9bcf-12bb97331649.png

18、pod一直处于pending’状态?

7442c080-fc4b-11eb-9bcf-12bb97331649.png

原因分析:由于已使用同样镜像发布了pod,导致无节点可调度。

74c57dfe-fc4b-11eb-9bcf-12bb97331649.png

解决方法:删除所有pod后部署pod即可。

74d0171e-fc4b-11eb-9bcf-12bb97331649.png

19、helm安装组件失败?

[root@k8s-master01 hello-world]# helm install

Error: This command needs 1 argument: chart nam

[root@k8s-master01 hello-world]# helm install 。/Error: no Chart.yaml exists in directory “/root/hello-world”

原因分析:文件名格式不对。

解决方法:mv chart.yaml Chart.yaml

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 容器
    +关注

    关注

    0

    文章

    543

    浏览量

    23066
  • 代码
    +关注

    关注

    30

    文章

    4985

    浏览量

    74590

原文标题:这些 K8S 日常故障处理集锦,运维请收藏~

文章出处:【微信号:gh_3980db2283cd,微信公众号:开关电源芯片】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    你的应用真的需要Kubernetes吗

    不需要的情况下,就投入大量人力物力去做迁移。结果往往是:迁移完成后,运维复杂度大幅上升,团队疲于应付各种 K8s 特有的概念和故障,而实际业务价值并没有显著提升。
    的头像 发表于 05-20 15:57 130次阅读

    K8s服务访问不通的排查方法

    Kubernetes 里服务访问不通是比节点 NotReady 更常见的故障场景。相比节点 NotReady 这种基础设施层的问题,服务访问
    的头像 发表于 05-11 16:49 243次阅读

    Helm包管理与模板化部署实战

    直接用kubectl管理K8s资源,10个微服务就要维护几十个YAML文件,版本管理靠文件夹命名,回滚靠手动替换文件。Helm把一组相关的K8s资源打包成Chart,支持模板化、版本管理、一键部署和回滚,是
    的头像 发表于 02-26 16:37 527次阅读

    Kubernetes容器运行时containerd与CRI-O如何选择

    Kubernetes 1.24版本正式移除了dockershim,Docker不再是K8s的默认容器运行时。这个变化直接影响了所有K8s集群的运维方式——升级到1.24+必须切换到containerd或CRI-O。
    的头像 发表于 02-26 09:54 566次阅读

    Kubernetes故障排查手册

    K8s集群故障是常态。Pod起不来、Service访问不通、节点NotReady、证书过期、etcd磁盘满——每一个问题都可能导致业务中断。和传统运维不同,
    的头像 发表于 02-26 09:47 471次阅读

    一文带你彻底搞懂K8s网络

    说实话,K8s 网络是我见过最让新手头疼的知识点,没有之一。记得我刚接触 K8s 那会儿,看着流量在 Pod、Service、Node 之间穿梭,完全是一脸懵逼。后来踩了无数坑,熬了无数夜,总算把这套网络模型摸透了。今天这篇文章,我会用最接地气的方式,带你彻底搞懂
    的头像 发表于 02-06 10:15 868次阅读

    K8s生产环境10大踩坑记录复盘

    这篇文章记录了我这些年在 K8s 生产环境踩过的坑。每一个案例都是血泪教训,有些甚至导致了生产事故。希望通过分享这些经历,能帮助大家避免重蹈覆辙。
    的头像 发表于 02-05 15:51 820次阅读

    K8s集群性能调优实战技巧

    大多数团队在遇到K8s性能问题时,第一反应是"加机器"。但根据我对超过50个生产集群的分析,80%的性能问题源于配置不当,而非资源不足。
    的头像 发表于 09-08 09:36 985次阅读

    K8s存储类设计与Ceph集成实战

    在云原生时代,存储是制约应用性能的关键瓶颈。本文将带你深入理解K8s存储类的设计原理,并手把手实现与Ceph的完美集成,让你的集群存储性能提升300%!
    的头像 发表于 08-22 11:50 1235次阅读

    高效管理Kubernetes集群的实用技巧

    作为一名经验丰富的运维工程师,我深知在日常的Kubernetes集群管理中,熟练掌握kubectl命令是提升工作效率的关键。今天,我将分享15个经过实战检验的kubectl实用技巧,帮助你像艺术家一样优雅地管理K8s集群
    的头像 发表于 08-13 15:57 1204次阅读

    Linux内核参数调优方案

    在高并发微服务环境中,网络性能往往成为K8s集群的瓶颈。本文将深入探讨如何通过精细化的Linux内核参数调优,让你的K8s节点网络性能提升30%以上。
    的头像 发表于 08-06 17:50 1258次阅读

    解析K8S实用命令

    前言: 作为运维工程师,掌握 Kubernetes 命令行工具是日常工作的核心技能。本文将深入解析 K8S 最实用的命令,从基础操作到高级技巧,助你成为容器化集群管理专家。
    的头像 发表于 07-24 14:07 1127次阅读

    k8s权限管理指南说明

    我们在目前的k8s集群环境里面,只能在master节点上执行kubectl的一些命令,在其他节点上执行就会报错。
    的头像 发表于 06-26 14:06 1045次阅读

    什么是 K8S,如何使用 K8S

    K8S 的优势与适用场景 优势: 跨平台:支持公有云、私有云、混合云及本地部署。 生态丰富:社区活跃,支持多种插件(如监控、日志、Istio 服务网格)。 高可用:自动故障恢复和负载均衡,保障
    发表于 06-25 06:45

    k8s网络的基本介绍

    Kubernetes网络是指在Kubernetes集群中不同组件之间进行通信和交互的网络架构。
    的头像 发表于 06-16 13:42 1117次阅读