0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中文信息处理实验室提出工具学习新框架ToolAlpaca

中科院软件所中文信息处理实验室 来源:中科院软件所中文信息处 2023-06-15 16:43 次阅读

如何让小规模语言模型像 GPT-4 一样使用任意工具是一个非常有价值的研究课题。中国科学院软件研究所中文信息处理实验室提出了一种语言模型的工具学习新框架,该框架利用基于大模型的多智能体模拟交互策略,可以自动生成多样化的工具使用数据集,并使用生成的数据集对小模型进行微调。论文的实验验证了仅需要使用三千多个多样化的工具调用实例,就能够使小型模型获得与极大规模模型相媲美的通用工具使用能力。

具体来说,本文的核心工作包括:

1. 提出一种基于大模型的多智能体模拟交互策略,用于生成工具使用数据集。这种方法能在最小化人工干预的前提下,生成大量且多样化的工具使用数据集;

2. 开源了一个涵盖超过400个工具,三千多条实例的模拟工具使用数据集,为探索通用工具使用能力奠定了基础;

3. 通过实验,验证了在多样化工具使用数据集上进行微调,能够使小型模型获得与极大规模模型相媲美的通用工具使用能力。

论文:ToolAlpaca: Generalized Tool Learning for Language Models with 3000 Simulated Cases

数据:https://github.com/tangqiaoyu/ToolAlpaca

背景工具的使用在人类进化史上占据了重要的地位,对于语言模型来说,这一点同样适用。当语言模型能够熟练运用各种工具,它们就能突破自身的局限,获取最新的信息,帮助用户利用各种服务,并提升回答的精确性。 如今,OpenAI 的 GPT-4 已经可以通过插件的形式接入和使用各种第三方工具,同时这类超大型的语言模型支持通过仅给定配置文件的情况下,以即插即用的方式使用之前模型训练过程中未见过的工具,这一泛化性的工具使用能力大大丰富了模型调动资源解决复杂问题的手段。然而,对于较小的语言模型,例如 Moss、ToolLLaMA 等,它们使用工具的能力仍然来源于在特定工具的数据集上进行监督学习。这使得这些模型的工具使用能力受限于在训练过程中接触过的工具,尚未真正获得通用的工具使用能力。上述的对比引出了研究人员所关注的一个核心研究问题,即是否有可能让较小规模的语言模型也具备有泛化地使用各种不同的、未见过的工具的能力,进而让它们能够更好地与更广泛的工具进行交互,从而提升模型利用现实世界的资源解决问题的手段。

ToolAlpaca:通用工具使用能力学习新框架

受 Alpaca 通过微调让小模型学会通用指令遵循启发,中文信息处理实验室的研究人员探索了通过在通用工具使用数据集上微调较小规模的语言模型,让它们获得通用工具使用能力。实现上述能力的一个核心难点在于需要构建一个多样化的工具使用数据集。然而,由于工具使用涉及复杂的多方交互,现今仍然缺乏公开可用的多样化工具使用数据集。为了解决这个挑战,研究人员提出通过多智能体模拟交互的方式生成工具使用数据集。这种方法充分利用大模型强大的文本生成能力,在几乎不需要任何人工干预的情况下构建一个多样化且真实的数据集。我们从构建多样化工具集开始,之后利用多智能体模拟生成工具使用数据集,最后基于此训练出拥有通用工具使用能力的 ToolAlpaca 模型。

45fa0b64-0a9c-11ee-962d-dac502259ad0.png

工具集构建:我们首先从开源仓库 public-apis 中获取工具的名称和简短描述作为初始信息,之后利用大语言模型通过 prompt 的方式将其扩展成自然语言形式的文档,描述工具提供的每一个函数及其对应的输入。为了让信息更为精细和结构化,我们进一步将这些自然语言文档扩展为遵循 OpenAPI 规范的文档,详尽描绘了每个函数的细节。结构化文档的使用不仅使我们的工具集更为细致和完备,同时也方便了我们的工具集与其他工具(如 ChatGPT 现有的 Plugin 等)进行兼容。下图为一个名为 Public Holidays 工具的示例。

462a8c44-0a9c-11ee-962d-dac502259ad0.png

工具使用实例生成:尽管我们已经构建了大规模且多样化的工具集,但构建工具使用数据集仍然是一项富有挑战性的任务。首先,由于工具集是由大模型生成的,要根据工具集文档构造如此大量的真实工具,需要大量的编程和数据收集工作,几乎不可能实现;其次,工具集本身包含了从通用到专用的各种领域的工具,使得构造与工具相关的初始指令是困难的。为此,我们提出了一种多智能体模拟交互的策略来生成工具使用数据。我们利用大模型分别模拟用户、AI 助手、工具执行器这三个智能体,通过他们之间的交互来生成丰富且实用的工具使用数据。

46566a12-0a9c-11ee-962d-dac502259ad0.png

如上图所示,用户发起最初的指令,并通过简单的交互提供更多必要的信息。工具执行器则利用结构化文档作为提示,借助大模型来模拟工具的执行过程,从而产生相应的反馈。而AI助手则充当两者之间的桥梁,它帮助用户调用各种工具以解决问题,并最终对整个交互过程进行总结,返回给用户最终的响应结果。通过这三个智能体的交互,我们成功构建了一套能贴近真实场景需求的工具使用数据集。

ToolAlpaca 模型训练与测试:我们使用生成的数据集对 Vicuna 模型进行微调,以此得到最终的 ToolAlpaca 模型。在测试阶段,ToolAlpaca 将担任 AI 助手的角色,同时用户和工具执行器的角色仍由大模型扮演。

实验

最终,我们利用 ChatGPT 和 GPT-3.5 构造了一个包含超过400个工具、3900多条工具使用实例的模拟数据集,数据集基本统计信息如下图所示。

46864e8a-0a9c-11ee-962d-dac502259ad0.png

之后,我们在Vicuna 模型上进行微调,得到 ToolAlpaca 模型。为了评估模型的泛化性能,我们在10种未包含在训练集中的工具上构造了含有100条数据的测试集,并通过人工评价对模型的工具调用过程和整体性能进行了评估。评测结果如下图所示。

46d1e610-0a9c-11ee-962d-dac502259ad0.png

实验结果表明,无论是7B还是13B的模型,经过在 ToolAlpaca 数据集上的训练后,其性能都有了显著的提升。值得注意的是,ToolAlpaca 在测试集上的整体性能已经接近于 GPT-3.5 的表现。这些实验结果验证了我们构建数据集的有效性,同时也回答了我们最开始提出的问题:通过在多样化的工具使用数据集上微调,可以让小模型获得通用的工具使用能力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 框架
    +关注

    关注

    0

    文章

    297

    浏览量

    17045
  • 语言模型
    +关注

    关注

    0

    文章

    434

    浏览量

    10044
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24351

原文标题:3000多个实例教会小模型通用工具使用能力!中文信息处理实验室提出工具学习新框架 ToolAlpaca

文章出处:【微信号:gh_e5b9d8c5c1d4,微信公众号:中科院软件所中文信息处理实验室】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    [原创]认证与实验室

    认证、实验室特写、电磁兼容、走进实验室、Q博士案例栏目。认证实验室专题范围:认证程序、工厂审查、标准理解、测试设备管理、标准的差异化等。栏目将对一次或多次不能通过认证的企业或产品,提出
    发表于 10-29 16:57

    飞思卡尔开发工具,嵌入式学习实验室必备

    飞思卡尔开发工具,嵌入式学习实验室必备昆山鑫盛盟创科技有限公司!飞思卡尔实验箱+教程,让您轻松学习嵌入式系统!昆山鑫盛盟创科技有限公司是f
    发表于 01-27 16:01

    新乡学院电子创新实验室规章制度

    。十三、实验室仪器设备发生故障应立即采取措施停止使用,待故障排除后再使用。十四、禁止用实验室电脑上网聊QQ以及打游戏、看电视等于学习无关的事。
    发表于 11-14 18:31

    NI信号处理实验室

    在NI官网下载了“信号处理实验室”,求源码而不可得,不知道哪位有源码?或者相关的源码
    发表于 07-31 09:20

    实验室整体解决方案是什么?

    三部分。中创盟是中国首家提出实验室整体解决方案这一概念的公司。如需了解更多实验室相关信息请联系苏州中创盟实验室技术有限公司居女士 0512-
    发表于 08-11 10:34

    实验室管理系列】实验室管理体系ISO/IEC17025内容拆解

    的知名度。下面对ISO/IEC 17025标准内容章节的简略拆解,供大家快速学习与参考。1.实验室的基础建设管理要素涉及ISO/IEC 17025标准第4.1、4.2、4.3、4.13章节2.实验室
    发表于 08-12 10:28

    如何建设电子实验室

    欢迎大家提供一些电子实验室建设的建议,比如硬件设备、软件、元器件和常用工具的需求。有清单更好。多谢!实验室能够完成电子设备的维修、设计和加工制作一些测量控制设备。
    发表于 02-28 21:03

    智慧实验室解决方案(LoRa)

    实验室是科技的摇篮,安全、健康、环保、节能是实验室的基本要素;实验室建设经历场地-设备-系统三个阶段。在当今成系统的实验建设理念中,实验室
    发表于 02-25 14:09

    KGB知识图谱引擎助力NLPIR中文信息处理

      随着信息时代的到了,计算机在人们生产生活的各个方面将起到越来远大的作用。而对于以汉语为母语的我国来说。中文信息处理技术已经在我国信息化建设中占据了一个非常重要的地位。  汉语在世界上属于汉藏语系
    发表于 11-09 11:39

    NLPIR大数据知识图谱完美展现文本数据内容

      随着科学技术的发展,中文信息处理已经深入到了社会生活的各方面。广泛的应用对中文信息处理技术也提出了较高的要求。中文信息处理中文(包括汉
    发表于 07-01 11:40

    Kilby实验室大揭秘

    也有很多人愿意跳出固有思维,提出各种假设和全新的想法。”推动技术变革  1958年9月12日,TI的工程师Jack Kilby向世人展示了第一块可运行的集成电路,Kilby实验室也由此得名。目前,TI在
    发表于 07-16 04:45

    智慧实验室教学管理系统平台开发设计案例

    `实验室管理系统开发LIMS和量化管理是现代实验室管理的标志,LIMS能实现实验室的量化管理,能提高实验室信息化水平,而量化管理能提高
    发表于 12-09 16:20

    系统控制与信息处理实验室 精选资料分享

    广西●河池学院广西高校重点实验室培训基地系统控制与信息处理重点实验室本篇博客来自河池学院: 智控无人机小组写作时间: 2020年8月15日培训总结培训训已经结束了,这一段的学习时间也告
    发表于 07-19 08:09

    lims实验室管理系统是什么?实验室信息管理系统介绍!

    采用实验室信息管理系统或LIMS可能是提高实验室生产力的最有效方法之一。此页面的目的是帮助目前未使用LIMS的科学家和实验室人员分析采用LIMS的潜在好处。对于已经使用LIMS的组织,
    发表于 11-03 11:17

    实验室lims系统解决方案

    ,需要不同的设备集成、工作流程工具等,因此该类别中的许多产品都是专门的。为什么要使用实验室lims系统?从电子表格到记录簿,传统的数据记录方法通常不足以满足现代实验室的需求。如果没有合适的工具
    发表于 11-04 11:18