最近,在测试圈和AI圈,"Skills"这个概念的热度高居不下,成为行业热议的焦点话题。
不少测试工程师和AI爱好者都在询问我:Skills到底是什么?它和刚推出的MCP(Model Control Platform)有什么关系?作为测试人员有必要学习这项技术吗?如果是零基础该如何快速上手?
其实,作为测试从业者,我们学习Skills的核心目的极其朴素且实用:用最低的学习成本,实现最高效的自动化,解决日常工作中的重复劳动问题。具体来说,通过Skills我们可以实现:
- 自动生成标准格式的测试用例
- 直接操作Excel文件进行数据处理
- 自动生成JMeter(JMX)性能测试脚本
- 批量处理测试报告和日志文件
- 自动化测试环境配置
这些功能都能帮助我们摆脱手动调整格式、编写重复代码的繁琐工作。以一个典型的应用场景为例:过去需要3小时手动编写的100个测试用例,现在通过Skills可以在5分钟内自动生成,且格式规范统一。
今天,我将为你送上一份测试人专属的Skills自学指南。这份指南特别值得关注的是,就在2026年3月11日,Anthropic公司刚刚发布了Skills 2.0的重磅更新,这次更新带来了三大突破性改进:
- 可视化开发界面,降低学习曲线
- 预置了200+测试专用模板
- 支持一键部署到CI/CD流水线
这些更新让Skill的开发从"手工作坊"式的编码模式,真正迈向了"工业化"的生产模式。本文将结合这些最新技术动态,帮助你站在自动化测试技术发展的最前沿。
一、 先搞懂:Skills 到底是什么?
一句话讲清:
如果把之前的普通Prompt(提示词)比作一本“种菜的说明书”,那么Skills就是“说明书+农具+机械臂”的组合包。
详细说明:
普通Prompt的局限性
- 传统Prompt就像一本静态的说明书,只能告诉AI“如何理解任务”(比如种菜的步骤),但无法赋予AI实际操作的能力。
- 例如:你让AI“分析PDF里的数据”,它只能输出文字建议,但无法直接打开文件或提取表格。
Skills的升级能力
- 说明书(增强的Prompt)Skills包含更精准的指令,比如“按章节解析PDF,提取关键词并生成摘要”。
- 农具(封装脚本)通过内置Python/JS脚本,AI能调用工具(如PDF解析库、Excel处理模块)。
- 机械臂(自动化执行)AI可直接操作本地文件,比如从你电脑的PDF中提取表格,或自动整理Excel数据。
应用场景示例:
- 财务处理上传一份发票PDF,AI不仅能识别金额和日期,还能自动填入Excel模板并生成报表。
- 研究分析输入一篇论文PDF,AI直接提取参考文献列表,并用Python脚本整理成标准格式。
核心差异:Skills让AI从“顾问”升级为“助手”,既能提供方案,又能动手完成。
1. Skills 与 MCP 的区别
很多人会把Skills和MCP搞混,这里用一个比喻讲清:
- MCP(协议层)好比是“USB-C接口协议”。它规定了设备怎么连接、数据怎么传输,解决的是“AI如何调用外部工具”的通信标准问题。
- Skills(应用层)好比是“集成了芯片的扩展坞”。它不仅遵守USB-C协议,还内置了驱动程序和应用逻辑,告诉AI“去执行什么任务、按什么步骤”。
简单来说:MCP是“路”,让AI能走到工具旁边;Skills是“导航+驾驶动作”,让AI知道怎么把车开到目的地。
2. Skills 的内部结构
要会用甚至定制Skills,必须看懂它的“内脏”。一个标准的Pdf-skill结构如下(这是目前业内通用的标准结构):


- SKILL.md这是必须有的“大脑”。前半部分是元数据(告诉AI这个技能叫啥、啥时候用),后半部分是指令(详细的提示词,指导AI如何调用后面的脚本)。
- /scripts文件夹这是“手脚”。存放具体的Python或JS代码,比如操作Excel的库、生成PDF的脚本。
- 其他(REFERENCE.md)这是“参考书”。当接口很复杂时,单独给AI提供查阅资料。
3. github上一些热门Skills
anthropics:(https://github.com/anthropics/skills)
awesome-claude-Skills:
(https://github.com/ComposioHQ/awesome-claude-Skills/)
skillsmp:(https://skillsmp.com/zh)
平台内置了超过50,000种skills供选择,但需要注意甄别:部分不安全的skills可能存在盗取token的风险。建议优先选择star数量多、可信度高的skills,或者自行开发更安全可靠。
二、 3步快速上手:先会用,再优化
对测试人而言,上手Skills的核心原则是“先解决实际问题,再逐步深化”。不要一上来就啃代码,跟着下面三步走:
第一步:明确需求,选对工具
- 定位高频场景测试人常见的痛点通常集中在这几块:
- 用例生成根据需求文档生成Excel/Xmind格式的用例。
- 脚本开发自动生成Postman的JSON导入文件或JMeter的JMX脚本。
- 测试数据批量生成脱敏的SQL数据或模拟报文。
- 报告输出将Bug汇总自动转为周报。
- 工具选择新手建议从Trae或Cursor或Kiro入手。这类IDE天然支持Skill的加载和调用,配置简单,开箱即用。
第二步:上手使用现成 Skills,熟悉逻辑
不要重复造轮子,先去GitHub上“捡”现成的Skill用。
下载:在GitHub搜索“awesome-skills”或直接找Anthropic官方提供的Skills仓库。
导入:将下载的Skill文件夹(如excel-skill/)放入Kiro项目的.kiro/skills/目录下。
实战案例:假设你安装了xlsx skills,以前KIro没法直接写Excel,但现在你可以直接在对话框输入:
“使用 xlsx skills 生成20条关于‘登录功能’的测试用例,保存到‘登录测试用例.xlsx’。”
后台发生了什么?
生成的Excel里,应该已经整整齐齐列好了“用例编号、模块、前置条件、步骤、预期结果”等列,这就是Skill自动化的魅力。
- 读取指令大模型读取xlsx-skill/SKILL.md,明白自己现在有操作Excel的能力。
- 编写脚本模型根据指令,动态生成一段操作xlsx库的Python脚本。
- 执行与清理在本地沙箱环境执行脚本生成Excel文件,任务结束后自动删除临时脚本。
第三步:按需优化/自定义,适配测试场景
当现成的Skill不符合公司规范(比如用例格式必须包含“风险等级”字段)时,就可以动手改了。
- 简单优化(无需代码)
直接修改SKILL.md里的指令部分。例如在指令末尾加上:“注意:输出的Excel表格必须额外增加‘风险等级’列,并根据接口重要性自动填入高/中/低。” - 自定义开发(需基础前置知识)
- 核心规范Skill的名称要直观(如api-testcase-to-jmeter),描述要精准(如“适用于将Swagger接口定义转为JMeter脚本”)。
- 文件编写复用Anthropic官方模板编写SKILL.md。如果你有代码能力,在/scripts下放一个处理复杂逻辑的Python脚本,然后在SKILL.md里告诉AI“遇到XXX情况,请调用scripts/generate_jmx.py处理”。
三、 可能会踩的坑
不少同学试了两下觉得不好用,多半是踩了这坑:
初入三坑:
追求全能,忽略场景适配
坑:想用一个Skill解决“生成用例+执行测试+发邮件报告”所有事,结果提示词复杂到AI都理解不了,输出质量极差。
避坑:单一职责原则。一个Skill就干一件事,比如“Excel格式化输出”,把它做到极致。
过度依赖,不做校验
坑:AI生成的JMeter脚本里,线程组配置错了,没检查就直接拿去压测,结果测了个寂寞。
避坑:人机协同。把Skills当成一个“效率极高的实习生”,它干完活,你作为导师必须做Code Review或结果校验。
上来就开发,不先复用
坑:新手花两周自己写了个“生成测试数据”的Skill,结果发现GitHub上开源的faker-skill比自己写的好用一百倍。
避坑:先尝后买。先复用现成的,摸清门道了,再根据公司的特定中间件(如自研的配置中心)开发私有Skill。
进阶三坑:
4. 上下文污染,Skill之间互相打架
坑:在同一个对话窗口里,既加载了“Excel用例生成Skill”,又加载了“Xmind脑图生成Skill”。当你输入“帮我生成登录用例”时,AI懵了:它可能同时读取了两个Skill的指令,结果输出既不是标准的Excel,也不是完整的Xmind,而是四不像。这叫上下文污染。
避坑:隔离环境,专事专办。养成好习惯:一个对话窗口只专注处理一类任务。如果要切换任务,开启新对话,或者明确在Prompt中指定“请忽略其他Skill,只使用XXXSkill”。
5. 环境依赖缺失,Skill运行报错
坑:从GitHub下载了一个看起来很牛的“PDF解析Skill”,导入后运行报错。一查发现,这个Skill的/scripts文件夹里用到了pypdf2库,但你的本地Python环境根本没装。AI尝试执行时报错,新手直接懵了。
避坑:环境即代码,清单化管理。下载Skill后,先看有没有requirements.txt或类似文件。在Cursor/Trae这类工具中,通常需要在终端手动安装依赖。建议Skill作者在SKILL.md里明确写明依赖,使用者养成“先装依赖,再跑Skill”的习惯。
6. 指令模糊,AI猜不透你的真实意图
坑:你输入“用Excel Skill生成用例”。AI确实用了,但生成的Excel里只有三列(步骤、预期、结果),而你们公司规范要求七列(用例编号、模块、优先级、前置条件、步骤、预期结果、实际结果)。你觉得AI不行,AI觉得你没说清楚。
避坑:指令工程,精确传达。好的Prompt是成功的一半。你可以优化输入:“用Excel Skill生成登录模块的测试用例,严格按照公司规范模板输出:包含用例编号_TC001、模块_登录、优先级_P0、前置条件、测试步骤、预期结果六列,表头加粗并自动适配列宽。” 把规范“喂”给AI,它才能吐出你想要的东西。
四、 最新动态:Anthropic 刚刚更新了什么?
就在前天,AI界发生了一件大事,直接关系到我们怎么学Skills :
Anthropic 发布了 Skills 的两大工业化更新:
- 《Skills编写完整指南》一份长达33页的官方规范。这意味着Skill的开发不再是野路子,有了标准化的“说明书”。测试团队在编写自己的私有Skill时,有了权威的参考依据。(https://github.com/anthropics/skills/blob/main/skills/skill-creator/SKILL.md)
- “技能生成器”新增评估功能以前我们不知道写的Skill好不好,现在官方工具可以量化技能质量、优化触发准确率。简单说,AI能自己测试这个Skill好不好用了,这对于我们后续构建企业级的Skill库是个重大利好。
这标志着AI智能体生态正在走向工业化,测试人现在上车,正是时候。
五、 kiro安装 Skills教程
配置 Kiro Skill 其实就是把一系列特定的工作流程指令“教”给 Kiro,让它能在对话中自动调用。整个过程主要分为创建和导入两种方式。
你可以把 Skill 理解为一个封装好的“函数”,只要在对话中触发关键词,它就会自动执行预设好的步骤。
Skill 的存放位置
在开始之前,你需要了解 Skill 可以存放在哪。这决定了它的生效范围:
存放位置 | 作用范围 | 适用场景 |
|---|---|---|
.kiro/skills/ (项目目录下) | 当前项目/工作区 | 团队共享的代码规范、项目的特定部署流程等。 |
~/.kiro/skills/ (用户根目录下) | 全局,所有项目 | 个人常用的工作流,比如日志分析、文档生成等。 |
特别注意:Kiro 识别的是[技能名称]/SKILL.md这样的文件夹结构。如果把 Markdown 文件直接放在skills文件夹下,它是不会被识别的。
方法一:手动创建你的第一个 Skill
这是最核心的方法,让你能根据自己的需求定制 Skill。
创建文件夹:在上述任意一个skills目录下,为你的新技能创建一个文件夹。文件夹名就是技能的名字,建议使用小写字母、数字和连字符,比如pr-review。
创建核心文件:在刚才创建的文件夹里,新建一个名为SKILL.md的文件。这是技能的“大脑”,Kiro 通过读取这个文件来理解你的技能。
编写SKILL.md:这个文件有固定的格式,最上面是YAML 格式的 Frontmatter,后面跟着Markdown 格式的指令。
---
# 技能的唯一标识符,必须和文件夹名一致
name: pr-review
# 技能的描述,非常重要!Kiro 通过匹配这段话来决定是否激活技能
description: 负责审查 Pull Request 的代码质量、安全问题和测试覆盖率。当用户提到“审查PR”或“准备代码审查”时使用。
---
## PR 审查清单
当你被要求审查一个 Pull Request 时,请遵循以下步骤:
1. **安全检查**:检查代码中是否存在安全漏洞,如 SQL 注入风险、硬编码的密钥或暴露的凭证。
2. **错误处理**:验证是否妥善处理了各种边界情况和可能的失败模式。
3. **测试覆盖**:确认新添加的代码有对应的单元测试或集成测试。
4. **代码风格**:确保变量和函数命名清晰易懂,符合项目规范。
5. **遗留问题**:提醒移除开发过程中留下的调试代码,如 `console.log` 或 `print` 语句。
## 需要特别留意的问题
* 硬编码的凭据或 API 密钥。
* 缺少必要的输入验证。
* 未捕获的 Promise 异常。
* 在代码中引入不必要的复杂性。
- name 和description是必填项。description写得越精准,Skill 被正确激活的概率就越高。
(可选) 添加参考资料:如果你的技能需要依赖很多文档,可以在技能文件夹下创建一个references/目录,把详细的操作手册、配置指南等放进去。然后在SKILL.md里通过相对路径引用它们。
方法二:直接导入现成的 Skill
如果你不想从头开始,可以直接从 GitHub 等地方导入别人分享的 Skill。Kiro 的图形化界面让这件事变得很简单。
- 在 Kiro IDE 的左侧菜单栏点击 Kiro 图标。
- 找到 “AGENT STEERING & SKILLS” 选项,点击它右侧的“+”号。
- 在弹出的菜单中,你可以选择:
- 从 URL 导入粘贴一个 GitHub 上公开 Skill 的仓库地址。
- 从本地选择选择你电脑上已经下载好的 Skill 文件夹。
- 接着选择要导入的位置(当前工作区还是全局),Kiro 就会自动帮你下载并放置好。
推荐资源:你可以试试从https://github.com/anthropics/skills.git这个仓库获取一些现成的 Skill 来体验。
使用skill
使用excel-test-case-generator skill 需求为#prod.md

实战一下:Skill 是如何工作的?
一个 Skill 可以做的远不止是提供文本建议。比如,有人创建了一个性能测试分析 Skill,当你对它说“分析 test_result.json”时,它会自动执行以下操作:
- 解析数据调用内置的analyze.js脚本,分析原始的 JSON 测试数据。
- 计算指标自动计算出 P95 响应时间、吞吐量等关键性能指标。
- 生成报告调用generate-html-report.js脚本,生成一份精美的 HTML 可视化报告。
整个过程完全自动化,你只需要发出一条指令即可。
几个小建议
- 精准描述花点心思写好description,这是 Skill 能被正确调用的关键。
- 迭代构建不必追求一步到位。可以先让 Skill 完成核心功能,再慢慢增加输出形式和美化效果。
- 版本控制建议把项目下的.kiro/skills/目录提交到 Git 仓库,这样整个团队就能共享同一套工作流了。
五、 测试人学 Skills,到底有什么用?
测试人的核心竞争力,是高效保障质量,而不是机械地敲键盘。日常大量的重复工作(格式转换、数据填充、脚本录制)占用了我们分析业务、探索性测试的时间。
Skills能让我们从“劳动者”变成“工具的定义者”。
目前,结合我遇到的测试痛点,已经梳理了几个测试实用Skill的开发思路,分享给你参考:
1、 测试数据智能管理类
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
Excel用例Skill | 告别手动合并单元格、调格式,AI根据需求描述直接输出规范格式的Excel测试用例文件。 | 手工测试用例设计、测试评审会准备。 |
Xmind用例Skill | 输入一句话需求或功能点,AI自动生成结构清晰的思维导图(Xmind格式),评审会可直接投屏讲解。 | 需求分析、测试设计 brainstorm、评审演示。 |
API测试用例Skill | 根据Swagger/OpenAPI文档,自动提取接口参数、枚举值、必填项,生成Postman可导入的JSON集合,包含正向、异常场景。 | 接口测试准备、CI/CD流水线集成。 |
JMeter脚本Skill | 根据接口定义文档,自动生成标准JMeter脚本(.jmx文件),配置好线程组、HTTP请求、监听器,导入即可进行压测。 | 性能测试脚本准备、快速压测验证。 |
测试数据脱敏生成器 | 输入生产库表结构,自动识别身份证、手机号等敏感字段,生成符合业务逻辑(如地域分布、年龄分布)的脱敏SQL/CSV数据。 | 开发本地调试、性能测试环境数据准备。 |
测试数据质量校验Skill | 对现有测试数据集进行扫描,自动发现数据分布偏差(如年龄全集中在20-30岁)、业务约束失效(如订单金额为负数)等问题,并输出优化建议。 | 大促前数据健康度巡检、自动化测试前置检查。 |
Mock数据智能生成器 | 根据API的Schema定义(如OpenAPI规范),自动生成各种边界值、异常值、组合场景的Mock响应报文。 | 前端联调、异常场景模拟。 |
2、 缺陷分析与复盘类
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
线上问题快速定位Skill | 输入报错信息或日志片段,Skill按预设规则执行:先查依赖服务健康度 → 再查错误码表 → 最后关联历史相似缺陷,输出问题类型和责任模块建议。 | 线上Oncall值班,快速响应。 |
缺陷报告智能优化Skill | 将开发或测试提交的原始缺陷描述,自动补全:环境信息、复现步骤、预期结果、日志截图建议,甚至自动生成最小化复现用例。 | 提升缺陷单质量,减少沟通成本。 |
事故复盘分析Skill | 输入事故描述,自动从测试视角复盘:判断缺陷本应在哪个阶段发现(需求/设计/编码/测试)?缺失的是用例、数据还是断言?并给出流程改进建议。 | 质量回溯、持续改进。 |
3、 文档与代码协同类
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
需求文档转测试点Skill | 输入产品需求PRD文档(Word/在线文档链接),利用NLP解析业务规则,自动输出标准化的测试点列表(按功能模块、优先级分组)。 | 需求评审前准备,快速生成测试思路。 |
代码变更影响范围分析Skill | 输入Git提交记录或Diff代码,自动识别变更的类/方法,关联调用链和业务模块,输出“建议回归的测试用例列表”和“高风险模块预警”。 | 精准测试、CI/CD门禁。 |
自动化脚本智能修复Skill | 当UI自动化用例因元素定位失效时,输入错误截图和DOM结构,Skill自动分析并推荐新的XPath/CSS定位符,甚至直接生成修复后的代码。 | 降低UI自动化维护成本。 |
4、 环境与配置管理类
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
测试环境自愈Skill | 定期巡检测试环境服务状态,发现服务宕机或端口无响应时,自动执行预设的恢复脚本(如重启Docker容器、清理磁盘空间)并通知相关人员。 | 7x24小时无人值守环境保障。 |
配置比对校验Skill | 输入两套环境(如预发 vs 生产)的配置中心地址,自动拉取关键配置项进行比对,输出差异报告,并高亮可能引发问题的配置项。 | 发布前配置检查、故障排查。 |
测试数据快照与回滚Skill | 在执行复杂测试前,自动对数据库关键表或Redis缓存进行快照;测试结束后,可根据快照一键回滚数据,保证环境整洁。 | 自动化测试数据清理、反复测试。 |
5、AI与专项测试融合
Skill思路 | 核心价值 | 适用场景 |
|---|---|---|
AI模型鲁棒性测试Skill | 输入图像识别/自然语言处理模型的API,自动生成对抗样本(如给图片加轻微噪点、文本同义词替换)进行攻击,评估模型在极端情况下的准确率下降程度。 | 金融风控模型、人脸识别门禁系统测试。 |
提示词注入攻击测试Skill | 针对集成大模型的应用,自动生成各种提示词注入(Prompt Injection)Payload,测试应用的安全防护能力,防止越狱或敏感信息泄露。 | AIGC应用上线前安全测试。 |
智能体协作流程校验Skill | 针对由多个AI智能体(如规划Agent+执行Agent)组成的复杂系统,输入一个端到端任务,自动追踪和验证每个Agent的决策和执行是否符合预期。 | 测试企业级智能体平台(如Dify、Coze应用)。 |
最后想对测试同仁说:Skills不难学,它本质上是对我们测试经验的“代码化封装”。能解决工作痛点、把我们从重复劳动中解放出来的工具,就是好工具。
最后奉上一首skill使用七言打油诗(避坑口诀),朗朗上口,方便记忆:
《Skills 六忌歌》
一忌全能贪大功
单一职责记心中
二忌偷懒不检查
复核一分钟不差
三忌闭门造新车
先搜现成不迷途
四忌多 Skill 同框聊
专事专办才可靠
五忌依赖缺环境
装好依赖再运行
六忌指令说不清
规范喂给 AI 听
-
测试
+关注
关注
9文章
6373浏览量
131639 -
AI
+关注
关注
91文章
40936浏览量
302512
发布评论请先 登录
国产人形机器人测试设备突围:如何拿下AI 终端的 “入场券”
AI辅助软件测试:几个关键路径
还在手写C++测试用例? Parasoft白盒级AI正在接管代码安全
模力方舟现已正式开源官方Skills仓库Moark Skills
Agent Skills与MCP:一场被误解的“替代战争”
嵌入式软件单元测试中AI自动化与人工检查的协同机制研究:基于专业工具的实证分析
革新科研智造,引领材料未来——高通量智能科研制备工作站
【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用
LambdaTest推出全球首个AI智能体测试平台
AI生成的测试用例真的靠谱吗?
未来测试圈新范式:不懂Skills的测试人,正在被AI悄悄淘汰
评论