0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架

智能感知与物联网技术研究所 来源:未知 2023-11-26 21:25 次阅读

AI Agents 是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的 LLM Agents 参与到实际的任务中,Agents 之间会进行竞争和协作等多种形式的动态交互,进而产生惊人的群体智能效果。本文介绍了来自 KAUST 研究团队的大模型心智交互 CAMEL 框架(“骆驼”),CAMEL 框架是最早基于 ChatGPT 的 autonomous agents 知名项目,目前已被顶级人工智能会议 NeurIPS 2023 录用。

wKgZomVjSFmAZGh7AAMUhEKDDJM406.png

论文题目:

CAMEL: Communicative Agents for “Mind” Exploration of Large Scale Language Model Society论文链接:https://ghli.org/camel.pdf

代码链接:

https://github.com/camel-ai/camel项目主页:https://www.camel-ai.org/

“什么神奇的技巧让我们变得智能?窍门就是没有窍门。智慧的力量源于我们巨大的多样性,而不是任何单一的、完美的原则。”

——人工智能先驱 马文·明斯基(Marvin Minsky)[1]

目前来看,在机器通向高级智能的道路上,以 ChatGPT 为代表的大模型(LLMs)应该是必须经过的里程碑之一,它们以聊天对话的人机交互方式在多个领域的复杂任务解决方面取得了非常耀眼的成就。

随着 LLMs 的发展,AI Agents(AI 智能体)之间的交互框架也逐渐兴起,尤其是在一些复杂的专业领域,以角色扮演等模式预置的智能体完全有能力代替人类用户在任务中扮演的角色,同时,智能体之间通过以协作和竞争形式的动态交互往往能够带来意想不到的效果,这就是被 OpenAI 人工智能专家 Andrej Karpathy 等人看作是“通向 AGI 最重要的前沿研究方向”的 AI Agents该领域发展的时间线如下 [2]:
  • “CAMEL”(骆驼:大模型心智交互框架)- 发布于 2023.3.21
  • “AutoGPT” - 发布于 2023.3.30
  • “BabyGPT” - 发布于 2023.4.3
  • “Westworld” simulation(斯坦福西部世界小镇) — 发布于 2023.4.7

作为最早基于 ChatGPT 的 autonomous agents 知名项目,CAMEL 重点探索了一种称为角色扮演(role-playing)的新型合作代理框架,该框架可以有效缓解智能体对话过程中出现的错误现象,从而有效引导智能体完成各种复杂的任务,人类用户只需要输入一个初步的想法就可以启动整个过程。目前,CAMEL 已经被国际人工智能顶级会议 NeurIPS 2023 录用

wKgZomVjSFqAUwEbAAiNKsGDC8U506.png

作者对 CAMEL 框架设计了灵活的模块化功能,包括不同代理的实现、各种专业领域的提示示例和 AI 数据探索框架等,因此 CAMEL 可以作为一个基础的 Agents 后端,支持 AI 研究者和开发者更加轻松地开发有关于多智能体系统、合作人工智能、博弈论模拟、社会分析、人工智能伦理等方面的应用。具体的,作者通过涉及两种角色扮演的合作场景,生成了两个大型的指令数据集 AI Society 和 AI Code,以及两个单轮问答数据集 AI Math 和 AI Science,用于探索 LLM 涌现能力的研究。

wKgZomVjSFqAKU58AAAl6LOgh3c752.png

CAMEL框架

下图展示了 CAMEL 中的 role-playing 框架,人类用户需要首先制定一个想要实现的想法或目标,例如:开发一个用于股票市场的交易机器人。这项任务涉及的角色是 AI 助理智能体(使其扮演 Python 程序员角色)和 AI 用户智能体(使其扮演股票交易员角色)

wKgZomVjSFqAXXQWAAYKK6pwmm4932.png

作者首先为 CAMEL 设置了一个任务细化器(Task Specifier),该细化器会根据输入的想法来制定一个较为详细的实现步骤,随后 AI 助理智能体(AI Assistant)和 AI 用户智能体(AI User)通过聊天的方式来进行协作通信,各自一步步完成指定的任务。

其中协作通信通过系统级的消息传递机制来实现,令为传递给 AI 助理智能体的系统消息,为传递给 AI 用户智能体的系统消息。随后为 AI 助理智能体和 AI 用户智能体分别实例化为两个 ChatGPT 模型,相应得到 AI 助理智能体和 AI 用户智能体角色分配完成后,AI 助理智能体和 AI 用户智能体会按照指令跟随的方式协作完成任务,令为时间时刻获得的用户指令消息,为 AI 助理智能体给出的解决方案,因而时刻得到的对话消息集为:

wKgZomVjSFqAfGQoAAAxY7qnz3A090.png

在下一个时刻,AI 用户智能体会根据历史对话消息集,来生成新的指令。然后再将新指令消息与历史对话消息集一起传递给 AI 助理智能体来生成新一时刻的解决方案:

wKgZomVjSFuAeX0RAAAsNWKo9tc027.png

更多技术细节,可以参考我们先前对CAMEL 的报道

wKgZomVjSFuAOKJaAAAuhh9-KLM135.png

CAMEL使用示例

2.1 协作角色扮演(cooperate role-playing)

CAMEL 内置的协作式 role-playing 框架可以在人类用户不具备专业知识的情况下,通过 Agents 之间的协作方式完成复杂任务,下图展示了 CAMEL 开发股票市场交易机器人的例子,其中 AI 助理智能体的扮演的角色是一名 Python 程序员,而 AI 用户智能体扮演的角色为一名股票交易员。

wKgZomVjSFuAPs0yAAnD9TVRoo8030.png

在 role-playing 框架中,AI 智能体都具有特定领域的专业知识,此时我们只需要指定一个原始想法的 Prompt,随后两个AI智能体就会围绕着这一想法展开工作,在上图中,用户智能体提出交易机器人需要有对股票评论的情绪分析功能,随后助理智能体直接给出了安装情绪分析和股票交易所需的 python 库的脚本。

wKgZomVjSFuAGtTEAAYQeHpbstk318.png

随着任务的进行,用户智能体给出的指示也会越来越明确,上图中的指示为:定义一个函数以使用 Yahoo Finance API 获取特定股票的最新股价。助理智能体会根据该指示直接生成一段代码来解决需求。2.2 具身智能体(embodied agent)在先前的研究中,AI Agents 可以理解为在模拟一些操作,而没有与现实世界交互或使用外部工具执行操作,目前的 LLMs 已经具备与互联网或其他工具API交互的能力,CAMEL 也提供了能够在物理世界中执行各种操作的具身智能体(embodied agent),它们可以浏览互联网、阅读文档、创建图像、音频视频等内容,甚至可以直接执行代码。wKgaomV1f7iAdS4qAAPWIU3JPf8135.png

上图展示了 CAMEL 通过使用 embodied agent 调用 HuggingFace 提供的 Stable Diffusion 工具链生成骆驼科图像的样例,在这一过程中,embodied agent 首先会推理出骆驼科所包含的所有动物,随后调用扩散模型生成图像并进行保存。

2.3 critic在环(critic-in-the-loop)

为了增强 role-playing 框架的可控性,作者团队还为 CAMEL 设计了一种 critic-in-the-loop,这种机制受到了蒙特卡洛树搜索(MTCS)方法的启发,它可以结合人类偏好实现树搜索的决策逻辑来解决任务,CAMEL 可以设置一个中间评价智能体(critic)来根据用户智能体和助理智能体出的各种观点进行决策来完成最终任务,整体流程如下图所示。

wKgZomVjSFyAcgHlAAKFz7AM7lM444.png

考虑这样一个场景,我们让 CAMEL 主持一场很具体的科研项目讨论会,而科研项目的主题“大型语言模型”,CAMEL 可以将用户智能体的角色设置为一个博士后,将助理智能体的角色设置为博士生,而中间评价智能体的角色设置为教授任务指示博士生来帮助博士后制定研究计划,需要围绕大模型的伦理展开研究。

wKgZomVjSFyAItxyAAiYLx6-Ffc627.png

在接到任务后,博士后智能体首先抛出了关于这一项目的三个观点,表明项目应该首先从调研大模型伦理方面的相关工作着手。随后教授智能体会根据这三个观点给出自己的看法。并且认为观点 2 最为合理的,即研究大模型歧视性算法同时还会给出另外两个观点的缺陷,例如观点 1 缺乏更加清晰的结构,观点 3 的研究范围太窄等等。

wKgZomVjSF2AIoqsABRoLVPKcfc606.png在教授发言之后,博士生智能体会进行更加具体的项目规划,例如直接列出一些大模型伦理安全方向的相关文献,并且讨论如何开展具体的研究。 wKgZomVjSF2Ab5tyAAAtJ0fTuoM170.png

实验效果

本文的性能评估主要从三个方面进行,并且采用两个 gpt-3.5-turbo 作为实验智能体,实验的数据集使用 CAMEL 框架生成的四个 AI 数据集,其中 AI Society 和 AI Code 侧重于智能体的对话效果,而 AI Math 和 AI Science 侧重于智能体的问题解决能力。3.1 Agent评估在这一部分,作者从 AI Society 和 AI Code 数据集中分别随机选择 100 个任务进行评估,然后使用 CAMEL 框架和单个 gpt-3.5-turbo 进行对比实验,结果评估方面分为两部分,一方面由人类受试者对两种方法给出的解决方案给出 453 份投票数据,来决定哪种方案更加可行另一方面,作者提示 GPT4 模型对两种方案直接给出评分,具体的对比数据如下表所示。

wKgZomVjSF2AId46AAIfhnJDJ3Q498.png

从上表中可以看出,CAMEL 框架给出的解决方案在人类评估和 GPT4 评估中均大幅优于 gpt-3.5-turbo 给出的解决方案,其中人类评估和 GPT4 评估的总体趋势高度一致3.2 使用GPT-4对ChatBot评估在这一部分,作者在 CAMEL 生成的四个数据集上对 LLaMA-7B 模型进行了逐步的微调,通过向 LLM 中不断注入来自社会、代码、数学和科学等不同领域的知识,来观察模型对知识发现的接受效果。

作者首先从 AI Society 数据集开始,让模型了解人类的互动常识和社会动态,随后 AI Code 和其他数据集的注入,模型获得了编程逻辑和语法的知识,同时拓宽了模型对科学理论、经验观察和实验方法的理解

wKgZomVjSF2AK1RZAAOvIfKaD1o016.png

上表展示了模型在20 个 Society 任务、20 个代码编写任务、20 个数学任务和 60 个科学任务上的测试效果,可以看到在每次添加数据集时,模型在已训练过的任务域上都会表现得更好。3.3 HumanEval

为了进一步评估 CAMEL 框架的代码编写任务解决能力,作者在 HumanEval 和 HumanEval+ 两个评估基准上进行了实验,实验结果如下表所示。

wKgZomVjSF6ATJzCAALMVWnWA_A809.png

上表中清楚地证明了 CAMEL 框架的卓越性能,它不仅远远超过了 LLaMA-7B 模型,而且还大大超过了 Vicuna-7B 模型,这表明使用 CAMEL 生成的数据集在增强 LLM 处理编码相关任务方面有独特的效果。 wKgZomVjSF6AGh69AAAC0jQz1zo980.svg

参考文献

wKgZomVjSF6AGh69AAAC0jQz1zo980.svg  

[1]Minsky M. Society of mind[M]. Simon and Schuster, 1988.

[2] https://towardsdatascience.com/4-autonomous-ai-agents-you-need-to-know-d612a643fa92


原文标题:NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2870

    文章

    41659

    浏览量

    358426

原文标题:NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架
    的头像 发表于 03-01 16:25 245次阅读

    华为发布通信行业首个模型

    在近日举行的MWC24巴塞罗那移动通信大会上,华为宣布推出通信行业的首个大型人工智能AI模型。这一创新性的模型被命名为“华为通信大
    的头像 发表于 02-27 14:31 320次阅读

    雷军称造车时便登门拜访各家车企 向所有中国新能源汽车先行者致敬

    雷军称造车时便登门拜访各家车企 向所有中国新能源汽车先行者致敬 在今天的小米汽车技术发布会上雷军就网友提出的为什么没有向上汽等车企致敬的问题时,雷军着重表示:“向所有中国新能源汽车先行者致敬
    的头像 发表于 12-28 18:06 392次阅读
    雷军称造车时便登门拜访各家车企 向所有中国新能源汽车<b class='flag-5'>先行者</b>致敬

    Ignite China | 两周后,来这里抢先看AI先行者们创造新增长

    原文标题:Ignite China | 两周后,来这里抢先看AI先行者们创造新增长 文章出处:【微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 12-27 12:20 209次阅读
    Ignite China | 两周后,来这里抢先看<b class='flag-5'>AI</b><b class='flag-5'>先行者</b>们创造新增长

    英飞凌试用Archetype AIAI开发者模型,以加强AI传感器解决方案创新

    2023 年 11 月 13 日 ,德国慕尼黑 讯】 全球功率系统和物联网领域的半导体领导者英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY)与物理世界AI先行者
    发表于 12-05 16:07 179次阅读

    开普勒人形机器人正式发布 硬核技术加持开启共创机器人新纪元

    11月17日,开普勒先行者系列通用人形机器人(以下简称"开普勒人形机器人")正式面世,包括先行者K1、先行者S1和先行者D1三个型号。
    的头像 发表于 11-18 11:57 1037次阅读

    NVIDIA 助力鹰瞳 Airdoc 眼科 AI模型建设与应用

    鹰瞳 Airdoc 是第一家在香港联交所上市的人工智能医疗公司,是全球眼科人工智能领域的先行者,致力于为慢性病早期筛查和管理、儿童青少年近视防控等提供全面和多方位的人工智能解决方案。
    的头像 发表于 11-17 21:30 558次阅读
    NVIDIA 助力鹰瞳 Airdoc 眼科 <b class='flag-5'>AI</b> 大<b class='flag-5'>模型</b>建设与应用

    华为全联接大会2023|华为发布业界首个网络大模型,加速行业智能

    华为全联接大会2023期间,华为重磅发布业界首个网络大模型——星河AI网络大模型,深度赋能iMaster NCE网络数字地图,加快网络数字化
    的头像 发表于 09-25 19:00 567次阅读
    华为全联接大会<b class='flag-5'>2023</b>|华为发布业界<b class='flag-5'>首个</b>网络大<b class='flag-5'>模型</b>,加速行业<b class='flag-5'>智能</b>化

    模型心高气傲,没有AI Agents生死难料

    AI Agents会消除人与AI系统的大量繁琐交互已经板上钉钉,正在发生
    的头像 发表于 09-06 20:56 431次阅读
    大<b class='flag-5'>模型</b>心高气傲,没有<b class='flag-5'>AI</b> <b class='flag-5'>Agents</b>生死难料

    AI Agents框架构成以及LLMs的基础知识

    智能代理(AI Agents)长期以来都被视为通往人工通用智能(AGI)的一条希望途径,预期中其能够通过自主规划和指令来自动完成相关任务。然而,早期的代理通常是一种编程实体,其通过传感
    的头像 发表于 09-06 16:27 1521次阅读
    <b class='flag-5'>AI</b> <b class='flag-5'>Agents</b>的<b class='flag-5'>框架</b>构成以及LLMs的基础知识

    优咔科技荣获智能网联领域先行企业奖

    奖,表彰优咔科技在车联网、智能驾驶等领域的行业贡献以及对其领先技术实力的认可。 优咔科技 CEO 闫楠先生(左一)上台领奖 早在2013年,来自通信运营商和设备商的一批先行者率先为车企提供车联网的连接管理服务,帮助车企构建可定制的连接管理平台,
    的头像 发表于 09-04 14:45 369次阅读
    优咔科技荣获<b class='flag-5'>智能</b>网联领域<b class='flag-5'>先行</b>企业奖

    产教融合发展的先行者!曙光致力于打造完整的智能计算产品线

    8月,伴随着中科曙光产教融合战略合作的签约,浙江省首个产业创新基地、全领域先进计算产教融合平台——中科曙光桐乡先进计算产业学院(以下简称产业学院)也揭开了神秘的面纱。   作为产教融合发展的先行者
    的头像 发表于 08-28 11:50 719次阅读

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    HHB 实现了在典型网络性能比第三方工具平均提升 88%,并增加支持运行 Transformer、TensorFlow、PyTorch 等 170 余个主流框架 AI 模型。 基于此,平头哥发布了
    发表于 08-26 14:14

    人工智能框架生态峰会2023成功举办

    [2023年6月16日,中国,上海] 今日,人工智能框架生态峰会在上海举办。峰会现场,昇思MindSpore携手行业用户与伙伴带来人工智能框架
    发表于 06-16 17:10 342次阅读
    人工<b class='flag-5'>智能</b><b class='flag-5'>框架</b>生态峰会<b class='flag-5'>2023</b>成功举办

    人工智能框架生态峰会即将召开,聚焦AI模型技术与科学智能探索!

    人工智能技术的迅猛发展正推动着全球创新的浪潮。在AI创新的背后,人工智能框架作为AI根技术,为开发者提供强大的工具和资源,扮演着至关重要的角
    发表于 06-14 09:21 149次阅读
    人工<b class='flag-5'>智能</b><b class='flag-5'>框架</b>生态峰会即将召开,聚焦<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>技术与科学<b class='flag-5'>智能</b>探索!