0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解读ChatGPT背后的技术重点

OSC开源社区 来源:Hugging Face 2023-02-09 17:11 次阅读

近段时间,ChatGPT 横空出世并获得巨大成功,使得 RLHF、SFT、IFT、CoT 等这些晦涩的缩写开始出现在普罗大众的讨论中。这些晦涩的首字母缩略词究竟是什么意思?为什么它们如此重要?我们调查了相关的所有重要论文,以对这些工作进行分类,总结迄今为止的工作,并对后续工作进行展望。

我们先来看看基于语言模型的会话代理的全景。ChatGPT 并非首创,事实上很多组织在 OpenAI 之前就发布了自己的语言模型对话代理 (dialog agents),包括 Meta 的 BlenderBot,Google 的 LaMDA,DeepMind 的 Sparrow,以及 Anthropic 的 Assistant (Anthropic 的 Claude 就是部分基于 Assistant 继续开发而得的)。

其中一些团队还公布了他们构建开源聊天机器人的计划,并公开分享了路线图 (比如 LAION 团队的 Open Assistant),其他团队肯定也有类似的内容,但尚未宣布。

下表根据是否能公开访问、训练数据、模型架构和评估方向的详细信息对这些 AI 聊天机器人进行了比较。ChatGPT 没有这些信息的记录,因此我们改为使用 InstructGPT 的详细信息,这是一个来自 OpenAI 的指令微调模型,据信它是 ChatGPT 的基础。

LaMDA BlenderBot 3 Sparrow ChatGPT / InstructGPT Assistant
组织 Google Meta DeepMind OpenAI Anthropic
能否公开访问 有限
大小 137B 175B 70B 175B 52B
预训练
基础模型
未知 OPT Chinchilla GPT-3.5 未知
预训练语料库大小 (词数) 2.81T 180B 1.4T 未知 400B
模型是否可以
访问网络
有监督
微调
微调
数据大小
质量:6.4K
安全性:8K
真实性:4K
IR:49K
大小从 18K 到 1.2M 不等的 20 个 NLP 数据集 未知 12.7K (此为 InstructGPT,ChatGPT 可能更多) 150K+ LM 生成的数据
RLHF
人为制定的安全规则
评价标准 1、质量 (合情性、具体性、趣味性)
2、安全性 (偏见) 3、真实性
1、质量 (参与度、知识运用)
2、安全性 (毒性、偏见)
1、校直 (有帮助,无害,正确)
2、证据 (来自网络)
3、是否违反规则
4、偏见和刻板印象
5、诚信度
1、 校直 (有帮助、无害、真实)
2、偏见
1、校直 (有帮助、无害、诚实)
2、偏见
用于数据标注的众包平台 美国供应商 亚马逊 MTurk 未知 Upwork 和 Scale AI Surge AI、Amazon MTurk 和 Upwork

我们观察到,尽管在训练数据、模型和微调方面存在许多差异,但也存在一些共性。上述所有聊天机器人的一个共同目标是「指令依从 (instruction following)」,即遵循用户指定的指令。例如,要求 ChatGPT 写一首关于微调的诗。

9f4047dc-a71f-11ed-bfe3-dac502259ad0.jpgChatGPT 指令示例

从预测文本到遵循指令

通常,基础模型的语言建模目标不足以让模型学会以有用的方式遵循用户的指令。模型创建者使用「指令微调 (Instruction Fine-Tuning,IFT)」方法来达到该目的,该方法除了使用情感分析、文本分类、摘要等经典 NLP 任务来微调模型外,还在非常多样化的任务集上向基础模型示范各种书面指令及其输出,从而实现对基础模型的微调。

这些指令示范由三个主要部分组成 —— 指令、输入和输出。输入是可选的,一些任务只需要指令,如上文使用 ChatGPT 做开放式文本生成的示例。当存在输入时,输入和输出组成一个「实例 (instance)」。给定指令可以有多个输入和输出实例。如下例 (摘自 Wang 等,'22):

9f51a9c8-a71f-11ed-bfe3-dac502259ad0.png指令和实例示例

IFT 的训练数据通常是人工编写的指令及用语言模型自举 (bootstrap) 生成的实例的集合。在自举时,先使用少样本技术输入一些样本给 LM 用于提示它 (如上图所示),随后要求 LM 生成新的指令、输入和输出。每一轮都会从人工编写的样本和模型生成的样本中各选择一些送给模型。人类和模型对创建数据集的贡献构成了一个谱图,见下图:

9f5e8990-a71f-11ed-bfe3-dac502259ad0.pngIFT 谱图

谱图的一端是纯模型生成的 IFT 数据集,例如 Unnatural Instructions (Honovich 等,'22);另一端是经由社区的大量努力精心制作的指令如 Super-natural instructions (Wang 等,'22)。在这两者之间的工作是使用一小组高质量的种子数据集,然后进行自举生成最终数据集,如 Self-Instruct (Wang 等,'22)。

为 IFT 整理数据集的另一种方法是将现有的用于各种任务 (包括提示)的高质量众包 NLP 数据集使用统一模式或不同模板转换为指令。这一系列工作包括 T0 (Sanh 等,'22)、Natural instructions 数据集 (Mishra 等,'22)、FLAN LM (Wei 等,'22) 和 OPT-IML (Iyer 等,'22)。

安全地遵循指令

然而,经过指令微调的 LM 并不总是能生成 有帮助的 和 安全的 响应。这种行为的例子包括通过总是给出无益的回应来逃避,例如 “对不起,我不明白。” 或对敏感话题的用户输入生成不安全的响应。为了减轻这种行为,模型开发人员使用 有监督微调 (Supervised Fine-tuning, SFT),在高质量的人类标注数据上微调基础语言模型,以提高有用性和无害性。例如,请参阅下面的表格(摘自 Sparrow 论文的附录 F)。

SFT 和 IFT 联系非常紧密。指令微调可以看作是有监督微调的一个子集。在最近的文献中,SFT 阶段经常被用于提高响应的安全性,而不是接在 IFT 后面提高指令相应的具体性。将来,这种分类和划分应该日臻成熟,形成更清晰的使用场景和方法论。

9f7e9bcc-a71f-11ed-bfe3-dac502259ad0.png人工安全规则

谷歌的 LaMDA 也根据一组规则 (论文附录 A) 在带有安全标注的对话数据集上进行微调。这些规则通常由模型创建者预先定义和开发,涵盖广泛的主题,包括伤害、歧视、错误信息。

微调模型

同时,OpenAI 的 InstructGPT、DeepMind 的 Sparrow 和 Anthropic 的 Constitutional AI 使用 人类反馈强化学习 (Reinforcement Learning From Human Feedback,RLHF) 来微调模型,该方法使用基于人类偏好的标注数据。在 RLHF 中,根据人类反馈来对模型的响应进行排序标注 (如,根据人类偏好选择文本简介)。然后,用这些带标注的响应来训练偏好模型,该模型用于返回 RL 优化器的标量奖励。最后,通过强化学习训练对话代理来模拟偏好模型。有关更多详细信息,请参阅我们之前关于 RLHF 的文章: ChatGPT 背后的“功臣”——RLHF 技术详解。

思维链 (Chain-of-thought,CoT) 提示 (Wei 等,'22) 是指令示范的一种特殊情况,它通过引发对话代理的逐步推理来生成输出。使用 CoT 微调的模型使用带有逐步推理的人工标注的指令数据集。这是 Let’s think step by step 这一著名提示的由来。下面的示例取自 Chung 等,'22,橙色高亮的部分是指令,粉色是输入和输出,蓝色是 CoT 推理。

9f96042e-a71f-11ed-bfe3-dac502259ad0.png

CoT 图解

如 Chung 等,'22 中所述,使用 CoT 微调的模型在涉及常识、算术和符号推理的任务上表现得更好。

如 Bai 等,'22 的工作所示,CoT 微调也显示出对无害性非常有效 (有时比 RLHF 做得更好),而且对敏感提示,模型不会回避并生成 “抱歉,我无法回答这个问题” 这样的回答。更多示例,请参见其论文的附录 D。

9fb63b9a-a71f-11ed-bfe3-dac502259ad0.pngCoT 和 RLHF 的对比

要点

与预训练数据相比,您只需要非常小的一部分数据来进行指令微调 (几百个数量级);

使用人工标注的有监督微调使模型输出更安全和有用;

CoT 微调提高了模型在需要逐步思考的任务上的性能,并使它们在敏感话题上不那么回避。

对话代理的进一步工作

这个博客总结了许多关于使对话代理有用的现有工作。但仍有许多悬而未决的问题有待探索。我们在这里列出了其中的一些。

RL 在从人类反馈中学习有多重要?我们能否通过在 IFT 或 SFT 中使用更高质量的数据进行训练来获得 RLHF 的性能?

为了安全的角度看,Sparrow 中的 SFT+RLHF 与 LaMDA 中仅使用 SFT 相比如何?

鉴于我们有 IFT、SFT、CoT 和 RLHF,预训练有多大的必要性?如何折衷?人们应该使用的最佳基础模型是什么 (公开的和非公开的)?

本文中引用的许多模型都经过 红蓝对抗 (red-teaming) 的精心设计,工程师特地搜寻故障模式并基于已被揭示的问题改进后续的训练 (提示和方法)。我们如何系统地记录这些方法的效果并重现它们?






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27052

    浏览量

    201435
  • COT
    COT
    +关注

    关注

    0

    文章

    19

    浏览量

    16384
  • OpenAI
    +关注

    关注

    8

    文章

    763

    浏览量

    5918
  • ChatGPT
    +关注

    关注

    27

    文章

    1411

    浏览量

    4776

原文标题:解读ChatGPT背后的技术重点:RLHF、IFT、CoT、红蓝对抗

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LLM风口背后ChatGPT的成本问题

    趁着ChatGPT这一热门话题还未消退,我们来聊一聊这类大规模语言模型(LLM)或通用人工智能(AGI)背后的细节。毕竟目前相关的概念股跟风大涨,但还是有不少人在持观望态度。无论是国外还是国内
    的头像 发表于 02-15 01:19 4185次阅读

    ChatGPT背后的算力芯片

    在今年以来可以说是最热的赛道,而AI大模型对算力的需求爆发,也带动了AI服务器中各种类型的芯片需求,所以本期核芯观察将关注ChatGPT背后所用到的算力芯片产业链,梳理目前主流类型的AI算力芯片产业上下游企业以及运作模式。   Chat
    的头像 发表于 05-21 00:01 3100次阅读
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>背后</b>的算力芯片

    【核芯观察】ChatGPT背后的算力芯片(二)

    在今年以来可以说是最热的赛道,而AI大模型对算力的需求爆发,也带动了AI服务器中各种类型的芯片需求,所以本期核芯观察将关注ChatGPT背后所用到的算力芯片产业链,梳理目前主流类型的AI算力芯片产业上下游企业以及运作模式。   接上期Chat
    的头像 发表于 05-28 00:34 2382次阅读
    【核芯观察】<b class='flag-5'>ChatGPT</b><b class='flag-5'>背后</b>的算力芯片(二)

    【核芯观察】ChatGPT背后的算力芯片(三)

    在今年以来可以说是最热的赛道,而AI大模型对算力的需求爆发,也带动了AI服务器中各种类型的芯片需求,所以本期核芯观察将关注ChatGPT背后所用到的算力芯片产业链,梳理目前主流类型的AI算力芯片产业上下游企业以及运作模式。   接上期Chat
    的头像 发表于 06-04 05:05 2138次阅读
    【核芯观察】<b class='flag-5'>ChatGPT</b><b class='flag-5'>背后</b>的算力芯片(三)

    【6.2】技术解读(框架、场景案例解读

    `技术解读(框架、场景案例解读)`
    发表于 06-04 17:12

    科技大厂竞逐AIGC,中国的ChatGPT在哪?

    产业版ChatGPT--ChatJD。 可见,大厂的态度十分鲜明:ChatGPT已经是既定的未来,这场新的科技竞技赛哨声响起,谁都不甘落于下风。从科技巨头,到行业龙头,中国企业竞逐AI赛道,AIGC(利用人工智能技术
    发表于 03-03 14:28

    什么是ChatGPT?行业如何看待ChatGPT

      ChatGPT的出现让投资者再次将目光聚集在AIGC(人工智能创作内容)赛道。近期,多只ChatGPT相关概念股分外活跃,这些个股背后的公司都有在AIGC赛道上布局相关业务。
    的头像 发表于 02-08 16:54 1w次阅读
    什么是<b class='flag-5'>ChatGPT</b>?行业如何看待<b class='flag-5'>ChatGPT</b>?

    详细解读ChatGPT 背后技术重点

    通常,基础模型的语言建模目标不足以让模型学会以有用的方式遵循用户的指令。模型创建者使用「指令微调 (Instruction Fine-Tuning,IFT)」方法来达到该目的。
    发表于 02-09 10:20 633次阅读

    解读ChatGPT背后技术重点:RLHF、IFT、CoT、红蓝对抗

    我们先来看看基于语言模型的会话代理的全景。ChatGPT 并非首创,事实上很多组织在 OpenAI 之前就发布了自己的语言模型对话代理 (dialog agents),包括 Meta
    的头像 发表于 02-09 10:20 1954次阅读

    ChatGPT背后的原理简析

     chatGPT是一种基于转移学 习的大型语言模型,它使用GPT-2 (Generative PretrainedTransformer2)模型的技术,并进行了进一步的训练和优化。
    的头像 发表于 02-09 15:09 7715次阅读
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>背后</b>的原理简析

    ChatGPT关于几个硬件问题的回答

    相比以往的AI对话模型,ChatGPT背后的自然语言处理技术着实让人感到惊叹。
    发表于 02-15 14:42 381次阅读

    ChatGPT for SegmentFault 插件来袭 ChatGPT for SegmentFault 插件使用方案解读

    机器人插件,可以帮助开发者快速构建聊天机器人应用。下文小编会给大家分享一下ChatGPT for SegmentFault 插件使用方案解读ChatGPT for SegmentFault
    的头像 发表于 02-16 18:45 2676次阅读

    ChatGPT成功背后技术原因

    ChatGPT不仅是自然语言理解领域的一项技术进步,会引发新一轮信息服务和内容生成领域的商业潮流,同时,其背后基于海量数据的深度生成技术,以及基于人类反馈的强化学习
    发表于 02-21 09:40 971次阅读

    ChatGPT背后的大模型技术

    由于ChatGPT可以适用于非常多的任务,很多人认为 AI 已经迎来拐点。李开复将此前的 AI 定义为 AI 1.0,此后的AI定义为AI 2.0。AI 1.0 中模型适用于单领域,AI 2.0
    的头像 发表于 05-29 11:16 930次阅读
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>背后</b>的大模型<b class='flag-5'>技术</b>

    chatgpt是什么意思 ChatGPT背后技术原理

      今天我们为大家带来的文章,深入浅出地阐释了ChatGPT背后技术原理,没有NLP或算法经验的小伙伴,也可以轻松理解ChatGPT是如何工作的。  
    发表于 07-18 17:12 0次下载