0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPT-3通过了大部分课程的写作测试

深度学习自然语言处理 来源:机器之心 作者:机器之心 2021-03-05 15:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPT-3 写的论文及格了吗?教育资源网站 EduRef 对此进行了一项测试,效果还行,及格水平。

2020 年 5 月,OpenAI 推出了具有 1750 亿参数的史上最大 AI 模型 GPT-3,该模型不仅可以更好地答题、翻译、写文章,还带有一些数学计算的能力。自推出以来,该模型就开始在不同的领域大显身手,如基于问题的搜索引擎、与历史人物对话、基于文本描述生成代码以及绘图和图像补全等等。

但 GPT-3 的应用之路远未结束…

近日,教育资源网站 EduRef 进行了一项测试,他们找了一组教授创建了一个写作提示,然后让应届毕业生和本科生以及 GPT-3 同时根据该提示写作,最后教授组对匿名提交的作文打分,并对作者进行追踪调查。那么,究竟结果如何呢?GPT-3 的分数能够超过人类作者吗?未必!

GPT-3 通过了大部分课程的写作测试

常言道:「评级为 C 就可以毕业(C’s get degrees)」。AI 远远达不到完美,GPT-3 的写作水平大概相当于自由写作者(freelance writer)。

结果显示,在 COVID-19 疫苗效力的研究方法论文写作上,人类作者可以得到 B 或者 D,而 GPT-3 往往只能得到 C。在美国历史类的测试中,人类作者可以在美国例外主义论文中得到 B 或者 C+,而 GPT-3 只能得到 B-。最后,在法学课上的政策函写作中,GPT-3 得到了 B-,而 3 个学生中只有 1 个能够得到高分。

下图为人类作者与 GPT-3 在不同学科写作中的得分情况:

由此可见,GPT-3 的写作技能主要体现在技术类文档中。在创意写作课程中的地点记叙文(place narrative)写作中,GPT-3 仅得到了 F,没有通过测试。作为对比,自由写作者得到了 A、B + 和 D+。尽管在创意写作教授的眼中,GPT-3 失败了,但自然语言生成(NLG)软件依然可以用于编写各类内容,包括一部几乎获奖的小说《The Day a Computer Writes a Novel》。先前的成功也预示着以后的失败,GPT-3 或许只需要一些调整即可以成为一名合格的创意作家。总的来说,AI 几乎通过了所有的课程写作测试。

GPT-3 20 分钟完成论文

虽然每个教授打分都不一样,但该评分小组包括两名博士和一名医学硕士。他们总共有超过 55 年的高中和各种大学水平的教学经验。写作者包括应届毕业生和本科生,其中一些人在他们的研究领域写了提示。平均来说,他们需要 3 天时间完成任务。

对于绝大多数学生来说,3 天内完成大学论文似乎是很难的事情,主要原因在于时间太短,但是 GPT-3 在 20 分钟内就完成了这个任务。GPT-3 利用深度学习产生类似人类的文本,每项任务花费 3 到 20 分钟完成,并且用最长的时间来编写创造性的写作叙述。为了避免人为干扰,GPT-3 只对输出长度和重复文本进行了轻微的编辑,其生成的内容、真实信息和语法都没有受到影响。

GPT-3 生成的美国历史类作文示例如下:

GPT-3 可生成类似人类写作的内容

即使没有人为干扰,GPT-3 的任务也或多或少地收到了与人类作者相同的反馈。49.2% 的评论涉及语法和句法,26.2% 的评论涉及重点和细节,语气与行文结构等也被提及,但分别只有 12.3% 和 10.8%。这与人类作家收到的评论比例几乎相同,近 50% 的评论与语法和句法有关,25.4% 的评论与焦点和细节有关。超过 13% 的评论是关于人类专业知识,而 10.4% 的评论是关于整体风格等。

人类作者与 GPT-3 的写作结果收到的评论反馈情况:

尽管收到了同样风格的评论,GPT-3 生成的内容与人类作者并不那么相似。以排名靠前的两个单词组合为例,GPT-3 和人类作者只分享了排名靠前的组合:「of the」。「People who」、「it is」和「those who」常被 GPT-3 使用,而人类作者经常使用的是「to the」、「in the」和「on the」。总体来说,这些单词是在英语中经常使用的,组合上的差异显示出 AI 和人类在写作结构上的一些差异。

人类作者与 GPT-3 在写作用词上的差异分析:

考虑到 GPT-3 超高的论文得分,搭配统计数据的差异表明,人类作者比 AI 产生的独特内容明显更多。

尽管 GPT-3 具有出色的产出,但其生成的论文在短期内还无法独立获得大学学位。当与人类作者竞争时,GPT-3 获得了一些及格分数,但在创意写作方面有所欠缺。尽管它在众多领域的成功为 AI 的未来带来了希望,但对大学教授来说,AI 依然存在不足。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296529
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710

原文标题:【GPT-3】除了缺少点创意,GPT-3写出了及格的大学毕业论文,只需20分钟

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智多晶SA5Z-50 FPGA器件通过单粒子效应测试

    在商业航天时代,如何让卫星、火箭等航天器在严酷的太空环境中稳定工作,同时有效控制成本,是整个行业面临的核心挑战。近日,智多晶的SA5Z-50 FPGA器件传来好消息,其成功通过了一项关键的“单粒子效应”测试,为解决这一挑战提供了新的选择。
    的头像 发表于 11-02 16:49 1806次阅读

    e203乘法器的优化分享

    计算通路计算出结果。 测试通过了coremark跑分验证 可以看到性能有了比较大的提升 ,从原来的2.1 到了 3.08
    发表于 10-24 10:41

    上海 11月2日-3日《电路测试技术与测试实例及案例分析》公开课即将开始!

    课程名称:《电路测试技术与测试实例及案例分析》讲师:王老师时间地点:上海11月2日-3日主办单位:赛盛技术课程背景Randy基于十多年深厚的
    的头像 发表于 09-12 10:23 362次阅读
    上海 11月2日-<b class='flag-5'>3</b>日《电路<b class='flag-5'>测试</b>技术与<b class='flag-5'>测试</b>实例及案例分析》公开课即将开始!

    【RA4M2-SENSOR】3、使用GPT定时器-PWM输出

    这是通过软件来实现的,GPT 硬件本身不支持输出单个脉冲(One-Shot)功能。 当使用单个脉冲(One-Shot)模式时,必须要开启中断,计时器需要在脉冲周期结束后在 ISR 中断服务函数中被停止
    发表于 09-01 15:20

    震惊,原来大部分电器都离不开它

    大部分电器都离不开变压器吗 是的,绝大多数电器设备都直接或间接依赖变压器,但具体形式因用电场景而异。以下是详细分析: 1. 哪些电器必须用变压器? 交流电(AC)设备: 家用电器
    的头像 发表于 06-24 14:10 633次阅读

    【技术分享】从EMC到极限温升,插板式模组都通过了哪些“地狱测试”?

    插板式模组是ZLG致远电子开发的可灵活设计的远程I/O扩展模块,可通过定制化底板集成各类接口,搭配多种功能模块,那它们的稳定性能得到保证吗?本文来讲一讲插板式模组经历的那些“地狱测试”。九大测试
    的头像 发表于 06-17 11:36 548次阅读
    【技术分享】从EMC到极限温升,插板式模组都<b class='flag-5'>通过了</b>哪些“地狱<b class='flag-5'>测试</b>”?

    知行科技全资子公司拟收购小工匠机器人大部分股份

    近日,知行科技旗下专注机器人研发及商业化的全资子公司艾摩星机器人与苏州小工匠机器人有限公司(“小工匠”)签署股权转让框架协议,艾摩星机器人将出资收购小工匠大部分股份,成为控股股东。以此为开端,知行科技正快速提升在机器人关键部件层面的技术积累,在加速拓展具体场景应用方面,迈出坚实一步。
    的头像 发表于 05-13 14:51 723次阅读

    【RA-Eco-RA4M2开发板评测】RA-Eco-RA4M2 PWM输出

    } 笔者这里只是使用了R_GPT_Open()和R_GPT_Start()函数,就是公用默认的频率和占空比就好了。 大部分初始化的工作已经通过软件生成了,因此实现起来就比较简单。
    发表于 04-28 22:57

    马斯克发布Grok 3大模型,超越GPT-4o

    多项benchmark测试中,Grok 3取得了比DeepSeek-v3GPT-4o以及Gemini-2 pro更优的效果。这一成绩无疑彰显了Grok
    的头像 发表于 02-19 13:50 720次阅读

    OpenAI即将发布GPT-4.5与GPT-5

    近日,OpenAI的首席执行官Sam Altman在社交平台上透露了公司即将推出的重大计划。据他透露,OpenAI计划在不久的将来连续发布两款重要的AI算法——GPT-4.5和GPT-5。 据悉
    的头像 发表于 02-13 13:43 1015次阅读

    OpenAI即将推出GPT-5模型

    先进技术,其中包括备受瞩目的o3工具。通过整合这些技术,GPT-5模型将实现更加强大的功能和性能。 值得一提的是,GPT-5模型将被广泛应用于OpenAI的聊天机器人ChatGPT以及
    的头像 发表于 02-13 11:21 913次阅读

    OpenAI CEO预告GPT-4.5及GPT-5未来规划

    全新的GPT-5模型。这一模型将整合包括o3在内的多项OpenAI先进技术,旨在为用户带来更加智能、高效的使用体验。值得注意的是,免费版的ChatGPT也将在标准智能设置下无限制地使用GPT-5进行对话,这无疑将进一步提升用户的
    的头像 发表于 02-13 10:02 743次阅读

    大部分的干扰问题都来自电源和地

    大部分的干扰问题都来自电源和地,分享一个很好的PDF文档,文末附文档获取方式。  
    的头像 发表于 01-15 17:37 804次阅读
    <b class='flag-5'>大部分</b>的干扰问题都来自电源和地

    季丰电子3D超景深数字显微镜简介

    日前,季丰电子与上海交通大学合作开发的3D超景深数字显微镜HY01正式通过了专家组验收。
    的头像 发表于 12-30 10:40 1255次阅读

    OpenAI正式推出Canvas:写作编码新平台,支持Python

    近日,OpenAI在连续发布新功能的节奏中,正式向全体ChatGPT用户开放了全新交互界面Canvas。这款工具基于OpenAI最新的GPT-4o模型,旨在为用户提供一个强大的写作和编码协作平台
    的头像 发表于 12-12 10:06 964次阅读