0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让浏览器自己工作:AI自动化技术落地全攻略

京东云 来源:jf_75140285 作者:jf_75140285 2025-08-25 16:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

自动化技术的演进与现状

在数字化转型的浪潮中,自动化技术已经从简单的脚本执行发展为具备智能决策能力的复杂系统。根据Gartner最新报告,到2025年,超过70%的企业将在其业务流程中采用某种形式的AI驱动自动化。这种转变不仅提高了效率,更重要的是赋予了自动化系统前所未有的适应性和创造力。

传统自动化工具虽然能够完成重复性任务,但面对动态变化的网页元素、复杂的用户交互场景时往往力不从心。这正是AI技术可以大显身手的地方——通过机器学习算法理解上下文,做出智能决策,并实时调整执行策略。

传统自动化VS智能自动化

流程图

传统自动化

wKgZPGisGiqAArXxAACh8v6Y_fw098.png

智能自动化

wKgZO2isGiyAVjbtAAMZgkpnqdI235.png

各自特点

维度 传统自动化 智能自动化
元素定位 精确选择器匹配 视觉特征+语义理解混合定位
流程设计 固定工作流 基于目标的动态路径生成
异常处理 预设try-catch块 实时诊断+自主恢复
测试数据 静态数据集 动态生成符合业务规则的数据
维护成本 变更导致大量脚本失效 自动适应部分UI变化
执行速度 快(毫秒级响应) 较慢(需AI推理时间)
准确定位 100%精确但脆弱 95%准确但健壮
适用场景 稳定业务流程 动态复杂场景

代码对比

传统自动化

async function testLogin(page) {
  await page.fill('#username', 'testuser');
  await page.fill('#password', 'Pass123!');
  await page.click('#login-btn');
  await expect(page).toHaveURL(/dashboard/);
}

痛点:元素ID变更即导致脚本失败

智能自动化

async function smartLogin(page, ai) {
  const context = {
    pageHTML: await page.content(),
    task: "完成登录操作",
    constraints: "使用有效测试凭证"
  };
  
  const plan = await ai.generateActionPlan(context);
  
  for (const action of plan.actions) {
    if (action.type === 'fill') {
      const element = await ai.locateElement({
        page: page,
        description: action.field
      });
      await element.fill(await ai.generateTestData(action.field));
    }
    // 其他动作类型处理...
  }
  
  const result = await ai.verifyOutcome({
    page: page,
    expected: "成功登录"
  });
}

优势:自动适应登录表单结构调整

使用技术

Playwright是什么?

Playwright 是由 Microsoft 开发的一款 跨浏览器、跨平台 的 Web 自动化与测试工具,支持 Chromium(Chrome/Edge)、Firefox 和 WebKit(Safari)。它提供了一套统一的 API,用于自动化浏览器操作,适用于:

端到端(E2E)测试

UI 自动化

网页截图 & PDF 生成

爬取动态渲染的网页

性能监控

详细介绍可参考此篇文章:点我跳转

MidScene.js是什么?

MidScene.js 是一款面向智能自动化的 AI 场景化编程框架,通过自然语言交互和机器学习能力,赋予传统自动化工具(如 Playwright)认知决策能力。它的核心定位是:

AI 增强型自动化:将大语言模型(LLM)与自动化脚本结合

低代码/无代码友好:支持自然语言描述任务场景

多模态交互:处理文本、图像、结构化数据等多种输入

企业级扩展:支持私有化部署和垂直领域微调

技术架构

wKgZPGisGi2AI9TSAAH0CoxHPFY658.png

网页或移动应用

网页自动化

与 Puppeteer集成
Puppeteer 是一个 Node.js 库,它通过 DevTools 协议或 WebDriver BiDi 提供控制 Chrome 或 Firefox 的高级 API。Puppeteer 默认在无界面模式(headless)下运行,但可以配置为在可见的浏览器模式(headed)中运行。

安装依赖

npm install @midscene/web puppeteer tsx --save-dev

demo脚本

import puppeteer from "puppeteer";
import { PuppeteerAgent } from "@midscene/web/puppeteer";

const sleep = (ms: number) => new Promise((r) => setTimeout(r, ms));
Promise.resolve(
  (async () => {
    const browser = await puppeteer.launch({
      headless: false, // here we use headed mode to help debug
    });

    const page = await browser.newPage();
    await page.setViewport({
      width: 1280,
      height: 800,
      deviceScaleFactor: 1,
    });

    await page.goto("https://www.ebay.com");
    await sleep(5000);

    // 

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38366

    浏览量

    297498
  • 自动化
    +关注

    关注

    30

    文章

    5895

    浏览量

    89510
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPS设计全攻略

    电子发烧友网站提供《GPS设计全攻略.pdf》资料免费下载
    发表于 12-01 17:10 0次下载

    医疗电子EMC整改:原理到实战的系统全攻略策略

    深圳南柯电子|医疗电子EMC整改:原理到实战的系统全攻略策略
    的头像 发表于 11-27 09:45 254次阅读

    工业 / 民用电表排线全攻略:安全合规 + 高效布线,90% 电工都在用的标准方案

    工业 / 民用电表排线全攻略:安全合规 + 高效布线,90% 电工都在用的标准方案 电表布线错一步,安全隐患埋十年!电工师傅、装修负责人、物业工程人员注意了—— 不合格的电表排线不仅会导致跳闸
    的头像 发表于 11-06 21:17 550次阅读
    工业 / 民用电表排线<b class='flag-5'>全攻略</b>:安全合规 + 高效布线,90% 电工都在用的标准<b class='flag-5'>化</b>方案

    从设计到落地,音圈执行如何适配你的自动化需求?​

    从设计到落地,音圈执行如何适配你的自动化需求?​-速程精密 不少企业搞自动化升级时,都会遇到同一个困惑:“明明选了口碑不错的传动部件,怎么用起来总觉得‘水土不服’?” 其实问题往往出
    的头像 发表于 10-29 15:32 179次阅读

    一文吃透WebSocket:智能物联网通信的入门与实战全攻略

    解决方案,助你轻松掌握这一核心技术。 一、WebSocket基础知识 1.1  什么是Websocket? WebSocket是HTML5下一种新的协议(本质上是一个基于TCP的协议),主要解决传统HTTP协议在 “实时通信” 场景下的效率问题。 它实现了浏览器与服务
    的头像 发表于 10-15 18:16 218次阅读
    一文吃透WebSocket:智能物联网通信的入门与实战<b class='flag-5'>全攻略</b>!

    亚马逊云科技推出Amazon Nova Act SDK预览版,加速浏览器自动化Agent落地

    北京2025年8月5日 /美通社/ -- 亚马逊云科技日前宣布,推出Amazon Nova Act SDK有限预览版,可快速帮助客户将基于浏览器的Agent从原型部署至生产环境。该SDK可与亚马逊云
    的头像 发表于 08-06 08:42 670次阅读

    自动化测试平台ATECLOUD推出AI算法功能

    作为纳米软件自主研发的自动化测试平台,ATECLOUD 始终致力于为用户提供高效优质的测试解决方案。面对5G、AI等前沿技术的迭代发展,平台深度融合新技术持续升级测试能力,最新推出的
    的头像 发表于 07-22 16:10 536次阅读
    <b class='flag-5'>自动化</b>测试平台ATECLOUD推出<b class='flag-5'>AI</b>算法功能

    老电视如何安装浏览器

    2017年购买的夏普老电视,1.5G+8G存储,网上下的浏览器APK文件在电视内打开就弹出“解析程序包出现问题”。 未知来源选项已打开,存储空间清空到只剩下三个应用(只占用300M左右),基本可
    发表于 06-01 18:57

    中小工厂也用得起!mes智能系统低成本落地全攻略

    在当今数字化时代,mes智能系统已成为工厂提升竞争力的关键工具。然而,对于资金和技术资源相对有限的中小工厂而言,如何以低成本实现mes智能系统的落地是一个亟待解决的问题。以下是一些实用的攻略。首先
    的头像 发表于 05-26 14:17 481次阅读
    中小工厂也用得起!mes智能系统低成本<b class='flag-5'>落地</b><b class='flag-5'>全攻略</b>

    UC3854 功率因数校正设计全攻略:从理论到实战

    【限时下载】UC3854 功率因数校正(PFC)设计全攻略:从理论到实战,工程师必备技术手册 *附件:《UC3854 功率因数校正设计全攻略:从理论到实战》.pdf 为什么工程师必须掌握这份资料
    的头像 发表于 04-09 15:35 1158次阅读
    UC3854 功率因数校正设计<b class='flag-5'>全攻略</b>:从理论到实战

    无感无刷直流电机驱动全攻略

    。 [*附件:无感无刷直流电机驱动全攻略.pdf](https://file1.elecfans.com/web3/M00/0C/79/wKgZO2fT04iAHISwAExmk6leMWw14
    发表于 03-14 14:58

    解锁 30KPA43A参数、特性与应用全攻略

    解锁 30KPA43A参数、特性与应用全攻略
    的头像 发表于 02-18 14:41 702次阅读
    解锁 30KPA43A参数、特性与应用<b class='flag-5'>全攻略</b>

    避坑指南:云服务数据库购买方法全攻略

    云服务数据库购买方法包含:先明确业务需求与数据库类型,再挑选信誉好、技术支持强的云服务提供商,接着根据需求配置数据库实例及选择付费方式。购买后,通过云管理平台访问管理数据库,并定期监控性能以优化运行。以下是UU云小编整理的一份详细的购买方法
    的头像 发表于 01-15 10:05 810次阅读

    AI工作自动化是做什么的

    AI工作自动化是指利用人工智能技术,对工作流程中的重复性、规则明确的任务进行自动化处理的过程。
    的头像 发表于 01-06 17:57 1491次阅读

    讯飞星火浏览器插件全新升级

    时刻陪伴,星火插件你的浏览器变成真正的生产力工具。
    的头像 发表于 12-25 09:48 1791次阅读