0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT实现原理

汽车电子技术 来源:综合整理 作者:综合整理 2023-02-13 17:32 次阅读

ChatGPT实现原理

用自然语言与计算机进行通信,ChatGPT实现了,那么ChatGPT实现原理是什么?

ChatGPT(Generative Pre-train Transformer)是由OpenAI发明的一种自然语言处理技术。它是一种预训练的深度学习模型,可以用来生成文本,识别语义,做文本分类等任务。

ChatGPT实现原理

火爆的ChatGPT,得益于AIGC 背后的关键技术NLP(Natural LanguageProcessing,自然语言处理)得到突破。自然语言处理应用在过去十年呈爆炸式增长,NLP技术是一种自然语言处理技术,用于计算机中模拟人类的对话和文本理解。主要源于AI大模型化的NLP技术突破是将深度学习技术与传统的NLP方法结合在一起,从而更好地提高NLP技术的准确性和效率。大模型化的NLP技术能够更好地支持企业进行大规模的语料内容分析,并为企业更好地进行文本分析提供帮助。

NLP类模型要理解单词的含义,还要理解如何造句和给出上下文有意义的回答,甚至使用合适的俚语和专业词汇。

我们看到ChatGPT的回答是这样的:

pYYBAGPqA6aAWexfAABOwAN7JNs369.png

ChatGPT的原理是基于自回归语言模型(Auto-Regressive Language Model),它是一种基于深度学习的自然语言处理技术,可以用来生成自然语言文本。它使用一种叫做Transformer的模型,它可以训练一个模型来预测下一个词,从而生成文本。

人类反馈强化学习

同时OpenAI采用了 RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习) 技术对 ChatGPT 进行了训练,而加入了更多人工监督进行微调。所以我们可以看到,一些错误的信息会逐步被更正。而且在很多用户的测试中可以发现,若用户指出其错误,模型会听取意见并优化答案。

InstructGPT/GPT3.5(ChatGPT的前身)与GPT-3的主要区别在于,新加入了被称为RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)。

InstructGPT的目标就是缓解这种生成回复与真实回复之间的偏置产生更加符合人类预期的回复。

chatGPT是一种基于转移学习的大型语言模型,它使用GPT-2 (Generative PretrainedTransformer2)模型的技术,使用了transformer的架构,并进行了进一步的训练和优化。

chatGPT是在GPT-2模型的基础上进一步训练和优化而得到的。 它使用了更多的语料库,并且进行了专门的训练来提高在对话系统中的表现。这使得chatGPT能够在对话中白然地回应用户的输入,并且能够生成流畅、连贯、通顺的文本。

那么接下来我们来看下什么是InstructGPT。从字面上来看,顾名思义,它就是指令式的GPT,“which is trained to follow an instruction in a prompt and provide a detailed response”。接下来我们来看下InstructGPT论文中的主要原理:

pYYBAGPknAmAfqGdAAFfaj7uGl0745.png

InstructGPT整体训练流程

从该图可以看出,InstructGPT是基于GPT-3模型训练出来的,具体步骤如下:

步骤1.)从GPT-3的输入语句数据集中采样部分输入,基于这些输入,采用人工标注完成希望得到输出结果与行为,然后利用这些标注数据进行GPT-3有监督的训练。该模型即作为指令式GPT的冷启动模型。

步骤2.)在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练reward反馈模型。

步骤3.)采样新的输入语句,policy策略网络生成输出结果,然后通过reward反馈模型计算反馈,该反馈回过头来作用于policy策略网络。以此反复,这里就是标准的reinforcement learning强化学习的训练框架了。

所以总结起来ChatGPT(对话GPT)其实就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型,最后通过强化学习的方式学习出对话友好型的ChatGPT模型。

InstructGPT的训练实际上是分为三个阶段的,第一阶段就是我们上文所述,利用人工标注的数据微调GPT3;第二阶段,需要训练一个评价模型即Reward Model,该模型需学习人类对于模型回复的评价方式,对于给定的上文与生成回复给出分数;第三阶段,利用训练好的Reward Model作为反馈信号,去指导GPT进一步进行微调,将目标设定为Reward分数最大化,从而使模型产生更加符合人类偏好的回复。

自然语言理解的不同发展阶段

在20世纪60年代,随着计算机技术的发展,自然语言处理技术也进一步提升。当时,美国国家科学基金会(NSF)成立了“自然语言处理研究计划”,专门用于支持自然语言处理技术的研究。同时,英国也成立了“自然语言处理研究室(Natural Language Processing Research Laboratory)”,专门致力于自然语言处理技术的研究与应用。

在20世纪70年代,自然语言处理技术又迎来了一个新的发展阶段。这一时期,自然语言处理技术发展到了语言学理论与计算机科学相结合的阶段。其中,语义学和句法学等语言学理论成为自然语言处理技术研究的重要基础。

在20世纪80年代,随着人工智能技术的进一步发展,自然语言处理技术也进入了一个新的阶段。这一时期,自然语言处理技术得到了广泛应用,并取得了一系列突破性成果。例如,英国语言工程研究所(LEL)在1983年成功开发出了世界上第一个基于人工智能的翻译系统,该系统能够将英语翻译成法语。

在20世纪90年代,自然语言处理技术进一步发展壮大。随着互联网的普及,自然语言处理技术在搜索引擎、社交媒体、客服机器人等领域得到广泛应用。此外,自然语言处理技术还进入了深度学习阶段,开始使用深度神经网络进行语言模型的建立和训练,从而提升自然语言处理技术的准确性和效率。如今,自然语言处理技术已经成为人工智能领域的重要组成部分,并在多个领域得到广泛应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26450

    浏览量

    264066
  • 深度学习
    +关注

    关注

    73

    文章

    5239

    浏览量

    119910
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13102
  • OpenAI
    +关注

    关注

    8

    文章

    760

    浏览量

    5914
  • ChatGPT
    +关注

    关注

    27

    文章

    1409

    浏览量

    4747
收藏 人收藏

    评论

    相关推荐

    GPT生成控制代码,四足机器人终于迎来智能交互

    电子发烧友网报道(文/周凯扬)早在GPT应用爆火后不久,机器人市场就看中了这个当下的香饽饽,考虑着如何将其集成到机器人应用中。半年过去,几个应用方向已经确立,比如用ChatGPT实现人机对话,或是
    的头像 发表于 07-20 01:13 1451次阅读

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    。”(FPGA礼貌地表示感谢,并挂断电话) 接下来我将开始一步一步实现。编写一个用FPGA访问ChatGPT4的程序代码是一个复杂的过程,涉及到硬件描述语言(如VHDL或Verilog)的编程、网络通信
    发表于 02-14 21:58

    在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计中,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    chatGPT帮我写硬件代码,是懂行的,好助手!#chatgpt #物联网开发 #python开发板

    ChatGPT
    苏州煜瑛微电子科技有限公司
    发布于 :2023年02月17日 15:27:42

    ChatGPT对话语音识别

    ChatGPT
    YS YYDS
    发布于 :2023年05月30日 22:13:10

    在IC设计/验证中怎么应用ChatGPT呢?

    好用,那么对于工程师群体应该帮助很大!按照官网的介绍,工程师们完全可以把所要实现的逻辑步骤用自然语言描述清楚,然后ChatGPT会翻译出满足相应要求的代码进行实现。话不多说,如图2直接上干货进行测试!图
    发表于 02-21 15:16

    科技大厂竞逐AIGC,中国的ChatGPT在哪?

    。 图源:OpenAI官网 中国AI水平与ChatGPT有多大的差距?中国如何训练出这样的GPT大模型?难点又在哪里? ChatGPT是AIGC的一种实现。在AIGC的大模型建设和应用层面,国内
    发表于 03-03 14:28

    如何让ChatGPT实现MIMO波束赋形

    不一定。很多它并不了解的知识,ChatGPT会拼凑出看似合理的答案,对初学者要引起充分的警惕。比如我问它某个西北菜怎么烹饪,它回答的头头是道、步骤清晰、逻辑性好,但做的方法并不对
    的头像 发表于 02-03 16:41 662次阅读

    在Python里使用ChatGPT

    前言近来 chatGPT 挺火的,也试玩了一下,确实挺有意思。这里记录一下在 Python 中如何去使用 chatGPT 。 本篇文章的实现100%基于chatGPT ,我是搬运工无疑
    发表于 02-15 10:17 2次下载
    在Python里使用<b class='flag-5'>ChatGPT</b>

    ChatGPT了的七个开源项目

    就推出了很多。估计,现在还有不少同学苦于不知道该如何体验chatGPT。   chatGPT火了,围绕chatGPT尽心二次扩展的开源项目最近也涌现出很多,今天就来给大家介绍几个最近发现的不错的开源项目!   这是一
    发表于 02-15 09:26 3次下载
    <b class='flag-5'>ChatGPT</b>了的七个开源项目

    如何让ChatGPT实现MIMO波束赋形和写一封会议邀请信?

    ChatGPT的对话过程中,必须写出便于理解、消除歧义的Prompts(提示,即你的指令或问题),它才可以理解你的意思,做出正确的应答。下面我们用两个例子,向大家展示好的Prompts会让它变得有多强。
    的头像 发表于 02-22 09:59 439次阅读

    基于ChatGPT实现微信机器人

    扫码登录过后,就能像开头文中截图那样跟机器人聊天啦。不过你要注意,我们的账户里只有5美元体验金,而这个API 的调用是要消耗金钱的,所以大家用来自己玩玩,体验体验就好,不然一会儿把体验金耗完就没得玩了。Wechatbot 的项目地址在这里https://github.com/qingconglaixueit/wechatbot,感兴趣的也可以去研究研究。
    的头像 发表于 03-30 10:34 2224次阅读

    人工智能技术的风险与应对措施

    进入智能化、信息化时代,以人工智能技术为基础的新一代信息科技不断向认知智能阶段迈进,特别是2022年11月美国人工智能Open AI公司研究发布的聊天机器人程序ChatGPT实现了人工智能从感知
    发表于 08-04 11:34 838次阅读

    人工智能技术的风险与应对措施

    进入智能化、信息化时代,以人工智能技术为基础的新一代信息科技不断向认知智能阶段迈进,特别是2022年11月美国人工智能OpenAI公司研究发布的聊天机器人程序ChatGPT实现了人工智能从感知理解
    的头像 发表于 08-06 08:09 1205次阅读
    人工智能技术的风险与应对措施

    ChatGPT是怎么实现

    ChatGPT 能够自动生成类似于人类写作的文本,这一点非常引人注目,也令人意外。但它是如何实现的?为什么它能够如此出色地生成我们认为有意义的文本?我的目的是在这里概述ChatGPT内部的运行
    的头像 发表于 10-16 11:31 549次阅读
    <b class='flag-5'>ChatGPT</b>是怎么<b class='flag-5'>实现</b>的