通俗易懂chatGPT原理-电子发烧友网

目前关于chatGPT的资料过于零散，没有详尽所有知识点、系统概述的文章，因此，笔者作了这篇总结性文章。

训练过程总览

理清演化路径

预训练(pretrain)

GPT-3概述

GPT 3模型的理念

GPT-3如何学习

数据集

指令微调 (Instruction Fine-Tuning，IFT)

有监督微调 (Supervised Fine-tuning, SFT)

人类反馈强化学习 (Reinforcement Learning From Human Feedback，RLHF)

其他方法

思维链 (Chain-of-thought，CoT)

与chatGPT类似的工作

引用

进NLP群—>加入NLP交流群(备注nips/emnlp/nlpcc进入对应投稿群)

训练过程总览

OpenAI 使用了 175B参数的大型语言模型（LM）和 6B参数的奖励模型（RM）。除预训练之外，训练过程分为三步：

收集NLP各种任务的数据集，加上任务描述和提示组装成新的数据集，并使用这些数据微调预训练的大型语言模型。包括指令微调和有监督微调。

从上述数据集中采样，使用大型语言模型生成多个响应，手动对这些响应进行排名，并训练奖励模型（RM）以适应人类偏好。

基于第一阶段的有监督微调模型和第二阶段的奖励模型，使用强化学习算法进一步训练大型语言模型。

img

理清演化路径

GPT-3.5 参数量仍然为175B，总体进化树如下：

img

预训练(pretrain)

GPT-3概述

GPT-3是一种自回归模型，仅使用解码器，训练目标也是预测下一个单词（没有判断下一句任务）。

最大的GPT-3模型有175B参数，是BERT模型大470倍(0.375B)

image-20230221144754842

GPT 3模型的理念

不需要接新的模型结构：如bert用于NER任务一般接LSTM+CRF

不需要微调

一个模型解决NLP多种任务

NLP任务都可以用生成模型解决

和人类一样，只需要看极少数量的样例就能学会

GPT-3如何学习

零样本学习：提供任务描述、提示

单样本学习：提供任务描述、一个样例、提示

少样本学习：提供任务描述、几个样例、提示

数据集

模型	发布时间	参数量	预训练数据量
BERT-large	2019 年 3 月	3.75 亿	约3.3GB
GPT	2018 年 6 月	1.17 亿	约 5GB
GPT-2	2019 年 2 月	15 亿	40GB
GPT-3	2020 年 5 月	1,750 亿	45TB

BERT-large：BooksCorpus 800M words、 English Wikipedia 2.5Bwords

GPT：WebText2, BooksCorpus、Wikipedia超过 5GB。

GPT-2：WebText2, BooksCorpus、Wikipedia总量达到了40GB。

GPT-3：**WebText2, BooksCorpus、Wikipedia、Common Crawl **等数据集45TB数据。

image-20230221153905277

指令微调 (Instruction Fine-Tuning，IFT)

收集NLP各种任务的数据集，加上任务描述和提示组装成新的数据集。chatGPT使用到的数据集如下：

image-20230221113507381

通俗易懂的PID教程

本帖最后由 Calvin248 于 2013-5-5 15:31 编辑帮助大家更好的理解PID算法，讲解的很通俗易懂，并且附有程序，帮助大家理解掌握！

发表于 05-05 15:30

labview串口通信最通俗易懂的图文详解

labview串口通信最通俗易懂的图文详解！如题

发表于 05-23 00:07

通俗易懂的PID算法

发几个通俗易懂的PID算法，需要的拿走

发表于 01-26 00:54

通俗易懂系列整合—电源基础知识讲解

之前发表了六篇用通俗易懂的话讲解电源知识的文章，分别是关于三极管、电阻、电容、电感、二极管和场效应管的讲解。怕想学习的坛友找不到内容，所以这边整合一下，给大家分享文章的链接。用通俗易懂的话让你明白

发表于 02-17 09:43

标准的PID处理例程(PID通俗易懂的讲解)[2]

发表于 06-13 11:44

PID通俗易懂

PID通俗易懂.....................

发表于 06-30 18:54

通俗易懂之电子称开发导航篇

通俗易懂之电子称开发立项篇https://bbs.elecfans.com/jishu_919726_1_1.html通俗易懂之电子称开发硬件篇https://bbs.elecfans.com

发表于 07-18 21:22

FPGA通俗易懂入门书籍教程

书籍内容通俗易懂，推荐大家下载学习！内容太大，打包4个压缩包。内容包括：1 AD采集 2 FIR滤波器设计3 信号发生器4 VGA...............等十多个案例分析。

发表于 11-15 10:51

通俗易懂的《路由和交换》

通俗易懂的《路由和交换》路由和交换是网络世界中两个重要的概念。传统的交换发生在网络的第二层，即数据链路层，而路由则发

发表于 08-01 10:39 •874次阅读

通俗易懂的单片机教程

通俗易懂的单片机教程

发表于 09-29 15:45 •636次下载

卡尔曼滤波的原理说明(通俗易懂)

很通俗易懂的卡尔曼滤波原理由浅入深不光是公式的介绍

发表于 12-08 18:13 •37次下载

卡尔曼滤波的原理说明(通俗易懂)

这是关于卡尔曼滤波的原理说明(通俗易懂)，适合初学者

发表于 03-16 14:40 •0次下载

PID通俗易懂

PID通俗易懂PID通俗易懂PID通俗易懂PID通俗易懂PID通俗易懂PID通俗易懂

发表于 04-19 09:54 •21次下载

步进电机基本原理(通俗易懂)

步进电机基本原理(通俗易懂)

发表于 11-30 11:55 •0次下载

最通俗易懂的ArkTS语言入门指南

本文为我整理出来最通俗易懂的 ArkTS 语言入门指南。

发表于 06-18 15:12 •2w次阅读

搜索历史

通俗易懂chatGPT原理

评论

通俗易懂的PID教程

labview串口通信最通俗易懂的图文详解

通俗易懂的PID算法

通俗易懂系列整合—电源基础知识讲解

标准的PID处理例程(PID通俗易懂的讲解)[2]

PID通俗易懂

通俗易懂之电子称开发导航篇

FPGA通俗易懂入门书籍教程

通俗易懂的《路由和交换》

通俗易懂的单片机教程

卡尔曼滤波的原理说明(通俗易懂)

卡尔曼滤波的原理说明(通俗易懂)

PID通俗易懂

步进电机基本原理(通俗易懂)

最通俗易懂的ArkTS语言入门指南