0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助京东AI言犀提升Kubernetes集群巡检的效率和准确性

京东云 来源:jf_75140285 作者:jf_75140285 2025-09-15 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

介绍

目前k8s-cluster-inspector组件可以自动化完成Kubernetes集群巡检,并在巡检结果中给出当前集群存在的问题,问题分级,问题类型,问题解决方法。

示例巡检数据结构如下:



{
       "name": "colocation-webhook-role",
       "namespace": "archimedes",
       "kind": "Role",
       "message": ["CanDeleteResources"],
       "issueCategory": ["Failed to pull image:WorkLoad"],
       "normal": false,
       "harmRank": ["CanDeleteResources:高危"],
       "repairMessages": ["CanDeleteResources:rbac中存在删除用户的风险,修复:在role,clusterrole增加标签:kubernetes.io/bootstrapping='rbac-defaults'"]
}

可见,其结果在一般的靠人力的情况下,对于问题的答案有一定限制。最终可能导致用户对结果不信任或者结果无法在可生产的环境中验证。

我们在借助AI工具,对于问题答案使用AI进行回答。将其结果回填到以上的巡检数据后,示例结果如下:

{
       "name": "colocation-webhook-role",
       "namespace": "archimedes",
       "kind": "Role",
       "message": ["CanDeleteResources"],
       "issueCategory": ["Failed to pull image:WorkLoad"],
       "normal": false,
       "harmRank": ["CanDeleteResources:高危"],
       "repairMessages": ["CanDeleteResources:集群中遇到镜像拉取报错401,通常是因为镜像仓库需要认证。解决方法如下:
 
1. **创建镜像拉取秘密**:在Kubernetes中创建一个Secret对象,用于存储镜像仓库的用户名和密码。
   ```yaml
   kubectl create secret docker-registry regcred --docker-server=< your-registry-server > --docker-username=< your-name > --docker-password=< your-pword > --docker-email=< your-email >
   ```
 
2. **在Pod或Deployment中引用Secret**:在Pod或Deployment的配置文件中,通过`imagePullSecrets`字段引用上述创建的Secret。
   ```yaml
   apiVersion: v1
   kind: Pod
   metadata:
     name: private-reg
   spec:
     containers:
     - name: private-reg-container
       image: < your-private-image >
     imagePullSecrets:
     - name: regcred
   ```
 
3. **应用配置**:更新或创建Pod/Deployment。
   ```bash
   kubectl apply -f your-pod-or-deployment.yaml
   ```
 
这样,Kubernetes在拉取镜像时会使用指定的认证信息,避免401错误。"]}

可见数据结果有较为明显的改进。并且借助AI工具,可以使得答案具有较高的丰富度和专业性。增加产品力。增强用户体验。

系统流程

主要流程区分:

1. 执行巡检模版

按照用户声明的巡检模版指令执行巡检

2. 开始巡检

开始巡检执行,该过程与Kubernetes集群交互

3. 渲染巡检结果

将巡检结果进行渲染,渲染过程中会调用AI接口,分装提示词,组装steam需要的上下文,将集群问题给到AI,并获取AI回答的结果,补充到结果集中。

4. 上报巡检结果

最终将巡检结果上报到用户指定的OSS存储服务器或者本地。

wKgZPGjH1MOAenZKAABiaQAkcSE719.png



provider 设计

在流程中中,AI provider设计目的是将AI 作为provider进行设计,可以支持多个AI提供方。每个AI提供方只需要实现调用方式即可。这在对外交付时,极大的提高了灵活性。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38271

    浏览量

    297321
  • 京东
    +关注

    关注

    2

    文章

    1066

    浏览量

    49892
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    确保X光设备检测的有效准确性的关键技巧

    在工业和安全领域,X光设备检测已成为不可或缺的重要环节。然而,许多用户常常面临检测效果不理想、准确性不足的问题,影响生产效率和安全保障。如何确保X光检测设备能够发挥最大效能,准确捕捉目标信息,是当前
    的头像 发表于 11-18 11:27 126次阅读

    电能质量在线监测装置的精度等级对其测量结果的准确性有何影响?

    电能质量在线监测装置的精度等级是衡量其测量结果准确性的 核心量化指标 ,直接决定了测量值与 “真实值” 的偏差范围。精度等级越高(如 A 级),误差限值越严格,测量结果的准确性越高;反之(如 B/C
    的头像 发表于 09-26 17:40 1055次阅读

    电能质量在线监测装置定位谐波源的准确性有多高?

    网、测点密集、同步精准),准确性可达到 90% 以上;在复杂场景(如广域电网、背景谐波波动大、测点稀疏),准确性可能降至 70% 以下。以下从 “准确性分级、关键影响因素、提升路径”
    的头像 发表于 09-26 15:20 390次阅读

    如何保障电能质量监测装置的准确性

    保障电能质量监测装置(以下简称 “装置”)的准确性,需贯穿其 “ 选型→安装→运行维护→校准→报废 ” 全生命周期,核心是通过 “ 源头把控硬件精度、过程规避干扰与退化、定期验证与修正 ”,确保装置
    的头像 发表于 09-23 16:03 508次阅读

    如何保证数据校验系统的时间同步以提高准确性

    在电能质量监测的数据校验系统中, 时间同步的准确性直接决定了多监测点数据的时空一致、暂态事件的时序匹配度,以及校验结果的可信度 。要保证时间同步以提升数据校验准确性,需从 “协议选择
    的头像 发表于 09-19 11:28 367次阅读

    高效管理Kubernetes集群的实用技巧

    作为一名经验丰富的运维工程师,我深知在日常的Kubernetes集群管理中,熟练掌握kubectl命令是提升工作效率的关键。今天,我将分享15个经过实战检验的kubectl实用技巧,帮
    的头像 发表于 08-13 15:57 625次阅读

    测缝计测量数据的准确性和校准方法解析

    在结构物安全监测领域,数据准确性是评估工程健康状态的核心依据。振弦式测缝计作为主流裂缝监测设备,其测量精度直接影响裂缝发展趋势的判断。那么如何确保测缝计测量数据的准确性以及如何校准?下面是南京峟思给
    的头像 发表于 07-07 13:56 449次阅读
    测缝计测量数据的<b class='flag-5'>准确性</b>和校准方法解析

    必知!影响手机气密检测准确性的重要因素

    移动设备防水防尘技术升级,手机气密检测成保障产品可靠的关键。但检测准确性受设备精度、环境稳定性、操作规范性及手机结构设计局限等因素干扰,影响测试结果、产品良品率和用户体验。影响手机气密
    的头像 发表于 07-04 14:26 623次阅读
    必知!影响手机气密<b class='flag-5'>性</b>检测<b class='flag-5'>准确性</b>的重要因素

    手表外壳气密检测仪:如何有效提升检测效率准确性

    在手表制造行业,手表外壳的气密检测至关重要。一款优质的气密检测仪能够精准判断手表外壳的密封性能,确保手表在各种环境下正常运行。那么,怎样才能有效提升手表外壳气密检测仪的检测
    的头像 发表于 06-07 14:01 608次阅读
    手表外壳气密<b class='flag-5'>性</b>检测仪:如何有效<b class='flag-5'>提升</b>检测<b class='flag-5'>效率</b>与<b class='flag-5'>准确性</b>

    DevEco Studio AI辅助开发工具两大升级功能 鸿蒙应用开发效率提升

    对DeepSeek模型增强融合了RAG能力,从生成机制上协同降低模型幻象,并同时提升生成模型的准确性和相关。 RAG检索增强的核心机制是通过“检索-生成”分离架构,将模型输出严格约束在可信数据范围内
    发表于 04-18 14:43

    DeepSeek推动AI算力需求:800G光模块的关键作用

    数据传输速率,减少带宽瓶颈,成为数据中心和AI集群架构优化的重点。光模块速率的跃升不仅提升了传输效率,也为大规模并行计算任务提供了必要的带宽保障。 800G光模块如何解决Dee
    发表于 03-25 12:00

    如何使用POT准确性检查器?

    :95:0.00% 分辨率视觉对象等级挑战 (VOC) 数据集未经英特尔验证。如 Yolo-v4-tf 文档 中所提到,英特尔已使用上下文中常见的对象 (COCO) 数据集验证了准确性。通过
    发表于 03-06 08:04

    引领智能制造:AR+AI双向巡检提升设备监控与员工反馈效率

    。 通过结合人工智能(AI)和增强现实(AR)技术,企业能够实现设备与员工的双向巡检,不仅让员工高效判断设备运行状况,设备本身通过AI模型也可以实时判断员工操作的准确性,进一步提高
    的头像 发表于 02-25 13:31 775次阅读
    引领智能制造:AR+<b class='flag-5'>AI</b>双向<b class='flag-5'>巡检</b>,<b class='flag-5'>提升</b>设备监控与员工反馈<b class='flag-5'>效率</b>

    如何提高OTDR测试的准确性

    OTDR(光时域反射仪)是光缆线路故障定位和光纤特性测量的重要工具,提高OTDR测试的准确性对于确保光缆线路的稳定运行至关重要。以下是一些提高OTDR测试准确性的方法: 一、准确设置OTDR参数
    的头像 发表于 12-31 09:25 1864次阅读

    如何提高电位测量准确性

    在电子工程和物理实验中,电位测量是一项基本而重要的任务。电位测量的准确性直接影响到实验结果的可靠和产品的安全。 1. 选择合适的测量设备 选择合适的测量设备是提高电位测量准确性的第
    的头像 发表于 12-28 13:56 1345次阅读