0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

格灵深瞳亮相AICon 2025全球人工智能开发与应用大会

格灵深瞳 来源:格灵深瞳 2025-07-05 16:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当前AI界和产业界,Agent成为现象级话题。企业Agent已经从热门概念走进产业现实,成为探索AI落地的新锚点。

此前,6月27-28日,由极客邦科技旗下InfoQ中国主办的“AICon全球人工智能开发与应用大会”在北京举办。作为行业领先的视觉AI公司,格灵深瞳受邀参会。

在“AI Agent构建与多场景实践”专题现场,格灵深瞳研发副总裁、AIInfra负责人闫梓祯分享了名为《构建高可信自动化企业Agent评测体系的实战方法论》的主题演讲,从企业Agent评测的重要性、现状、实战方法等维度,讲述了格灵深瞳团队对于这一话题的思考与实践。

“If you can't measure it,you can't improve it.” (如果你不去评测它,便无法提升它。)谈及评测对于企业Agent开发与落地的重要性,闫梓祯表示,有效评测是提升Agent应用效果的关键。随着模型能力快速提升,技术刷爆榜单的速度越来越快,应用层Agent开发亟需更有效、更严格的评估机制,才能更客观地反映AI的真实表现,解决技术参数与实际效果之间的gap问题。

基于多年的开发与交付经验,闫梓祯分享了现阶段企业Agent评测的发展状态和面临的问题。当前,企业Agent在各行业、各场景下的落地尚处于早期起步阶段,具体到评测环节,企业往往面临“如何评测”、“对接真实业务系统后如何保证应用效果”等实际问题。

对企业来说,真实反映AI能力、客观衡量AI效果的需求越来越迫切,相应地,实现难度也越来越大。如何构建一套高可信度、自动化、规模化的企业Agent评测系统,成为业内关注的焦点。

相较于单纯依靠人工评测,闫梓祯建议,使用大模型或者Agent相关技术来构建评测体系——让Agent自动生成评测数据集、自动对评测对象进行打分,从而实现整个评测流程的规模化和自动化。在格灵深瞳,已经鼓励研发人员和产品经理使用大模型来辅助评测工作,并取得了不错的表现。

但这种“Agent as a judge”的范式并不是万金油。当AI技术落地到复杂多变的现实工况中,依旧需要行业专家经验作为评测支撑。高自动化评测系统+人工介入,是目前更为有效的实际解决方案。

基于对评测体系的思考与实践,格灵深瞳构建了一套自研的Agent评测平台。在该平台能力的支撑下,开发者可以快速响应、高效优质地交付各行业定制化Agent。

例如,格灵深瞳在为金融机构、政企客户打造专属Agent时,该评测平台能够助力极大缩短开发周期,依靠数据生成快速构建场景,并利用沙箱环境提前模拟测试,提高交付质量。更重要的是,该平台的多维度指标和真实环境仿真,可以让Agent的输出结果既准确又合规,成为真正的专业级产品,经得住实际业务中的复杂考验。

在该评测系统的支撑下,企业Agent不仅是一个“能用”的工具,更是一个稳定、可靠、能持续进化的智能伙伴。未来,如何衡量企业Agent的价值,如何构建可靠、自动的评测系统,这背后的道与术,将是格灵深瞳持续思考和实践的致力方向。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38186

    浏览量

    296981
  • 人工智能
    +关注

    关注

    1813

    文章

    49757

    浏览量

    261675
  • Agent
    +关注

    关注

    0

    文章

    163

    浏览量

    28572
  • 格灵深瞳
    +关注

    关注

    1

    文章

    78

    浏览量

    5900

原文标题:企业Agent如何从“能用”到“好用”?格灵深瞳的评测实战方法论

文章出处:【微信号:shentongzhineng,微信公众号:格灵深瞳】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    精彩亮相百度世界2025大会

    11月13日,百度世界2025大会在北京国家会议中心二期举办。活动期间,与百度进行深入交
    的头像 发表于 11-19 17:09 473次阅读

    受邀参加百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行。在分论坛环节,灵感实验室
    的头像 发表于 11-14 15:47 396次阅读

    邀您相约百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行,主题为“效果涌现 | AI In Action”。在公开课环节,
    的头像 发表于 11-12 16:57 695次阅读

    亮相2025华为北京商业伙伴大会

    10月17日,华为北京商业伙伴大会·2025(第三届)在北京成功举办。作为华为的重要合作
    的头像 发表于 10-22 18:07 858次阅读

    视觉基础模型Glint-MVT的发展脉络

    此前,8月28-30日,2025百度云智大会在北京举办。在算力平台专题论坛上,技术副总裁
    的头像 发表于 09-05 17:13 1321次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础模型Glint-MVT的发展脉络

    智慧金融产品家族全新升级

    智能体时代,如何打造能用、好用、有持续成长性的智慧金融产品?这是探索 AI+金融深度融合的实践方向。
    的头像 发表于 08-19 17:53 1043次阅读

    智慧体育产品全新升级

    智慧体育产品家族,近期迎来全新升级。
    的头像 发表于 08-14 11:51 1197次阅读

    视觉基础模型Glint-MVT升级

    近日,灵感实验室和华为伦敦研究所发布最新版视觉基础模型——Glint-MVT v1.5(RICE)。
    的头像 发表于 07-31 11:01 1220次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础模型Glint-MVT升级

    与您相约WAIC 2025

    7月26-29日,2025世界人工智能大会(WAIC)将在上海世博中心和世博展览馆举行。
    的头像 发表于 07-26 16:14 963次阅读

    六篇论文入选ICCV 2025

    近日,国际顶级会议ICCV 2025(计算机视觉国际大会)公布论文录用结果,团队共有6篇
    的头像 发表于 07-07 18:23 1312次阅读

    亮相Create2025百度AI开发大会

    近日,Create2025百度AI开发大会在武汉体育中心圆满落幕,作为全球首个AI开发大会
    的头像 发表于 04-29 16:12 874次阅读

    与百度智能云达成战略合作,共筑AI算力新基建

    4月25日,在Create2025百度AI开发大会期间,百度智能云与格
    的头像 发表于 04-27 10:20 987次阅读

    入选量子位2025年AIGC双榜单

    4月16日,第三届中国AIGC产业峰会在京召开。大会由量子位主办,以“万物皆可AI”为主题,峰会C位焦点——“2025年值得关注的AIGC企业”与“2025年值得关注的AIGC产品”双榜单正式发布!
    的头像 发表于 04-18 09:20 792次阅读

    亮相第三届北京人工智能产业创新发展大会

    近日,第三届北京人工智能产业创新发展大会在国家会议中心二期盛大召开。大会由北京市科学技术委员会、中关村科技园区管理委员会、北京市经济和信息化局、北京市广播电视局主办,北京市门头沟区人民政府、华为技术
    的头像 发表于 03-04 18:22 915次阅读

    亮相中国铁路兰州局科技创新大会

    近日,中国铁路兰州局集团有限公司科技创新大会在兰州成功召开。作为深耕轨交行业的人工智能公司,
    的头像 发表于 12-17 16:56 884次阅读