0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI发布了一个“逆天”的AI模型——GPT2整个模型包含15亿个参数

电子工程师 来源:lp 2019-03-07 14:45 次阅读

上个月,OpenAI发布了一个“逆天”的AI模型——GPT2,整个模型包含15亿个参数。你给它一句话,它能给你编出一篇文章来。

OpenAI的研究主管Dario Amodei表示,GPT2是在一个包含大约1000万篇文章的数据集上进行培训的,比之前最先进的AI模型大12倍,数据集大15倍。

有这么厉害?看看他的实力水平不就知道了,OpenAI给出了这么一个开头:

在一项研究中,科学家们发现了一群独角兽,它们生活在安第斯山脉一个偏远的还没被开发山谷中,更令人惊讶的是这些独角兽会说一口流利的英语

就这么一句话,GPT-2能写出以下这么一大段故事:

因为它们独特的角,科学家们将他们命名为Ovid’s Unicorn,这些四角、银色角的独角兽是原来科学家所不曾见过的。

......中间还编写了,这些独角兽是如何被发现的,以及业内权威人士认为这些生物是如何出现的,最后还表明要验证这群独角兽是否为外星种族,唯一的方法可能就是通过DNA。

这一本正经的胡说八道,说的猿妹我都信以为真

能有这样出色的表现,不是没有原因的,GPT-2各种特定领域的语言建模任务中都取得了很好的分数。作为一个没有经过任何领域数据专门训练的模型,它的表现,比那些专为特定领域数据集(例如维基百科,新闻,书籍)上训练的模型。有图有真相:

除了能用于语言建模,GPT-2在问答、阅读理解、摘要生成、翻译等等任务上也都有非常好的成绩,openAI在博客上也给出了示例,感兴趣的可以前往查看(地址:https://blog.openai.com/better-language-models/)

除了以上提到的这些优异表现,最主要的是GPT-2还学习几种编程语言的语法模型,比如PHP和JavaScript。

它写出来的JavaScript长这样:

还有PHP语言:

就连Facebook AI研究院的Tim Rocktäschel看了GPT-2写出来的代码都表示:我们要有大麻烦了

话虽如此,该博客下面也有人表示其实,GPT-2写的代码不够严谨,容易把js、C++Python等语言混为一谈。但实力依然不可小觑

目前,GPT-2已经在GitHub上获得4116个Star,674个Fork(地址:https://github.com/openai/gpt-2),喜欢的人可以尝试一下

不过,OpenAI 的研究人员们决定不发布训练模型的数据、也不发布最大那个模型预训练后的参数,因为他们认为如此强力的模型有遭到恶意滥用的风险。最后,你们如何看待这个项目呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264030
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24348
  • 独角兽
    +关注

    关注

    0

    文章

    166

    浏览量

    26410

原文标题:这个开源AI逆天了!编故事问答翻译样样行,最主要的是还会写代码

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    预训练语言模型。该模型最大的特点就是基于以较小的参数规模取得了优秀的性能,根据官网提供的信息,LLaMA的模型包含4
    发表于 12-22 10:18

    GPT2模块的相关资料推荐

    定时器 GPT2 模块这次简单介绍下GPT2GPT2 模块框图**捕捉/重载寄存器 CAPREL 可用来捕捉定时器 T5 的值, 或者重载定时器 T6。 同时, 特殊模式促进两种功能对寄存器
    发表于 02-22 07:57

    科技大厂竞逐AIGC,中国的ChatGPT在哪?

    最近,AI(人工智能)圈股以“ChatGPT”为核心的热潮从美国“硅谷”涌入中国。 2022年11月底,初创公司OpenAI发布名为C
    发表于 03-03 14:28

    ChatGPT系统开发AI人功智能方案

    。ChatGPT是OpenAI开发的人工智能语言模型,可以实现自然语言处理、对话生成等功能。要开发
    发表于 05-18 10:16

    OpenAI宣布,发布了7.74亿参数GPT-2语言模型

    就在本周,OpenAI宣布,发布了7.74亿参数GPT-2语言模型,15.58亿的完整模型也有望
    的头像 发表于 09-01 09:10 2729次阅读

    史上最大AI模型GPT-3你要开始收费了 接下去可能用不起它了

    还记得前不久被捧上天的GPT-3么?那个只有被邀请的用户才能测试使用的,号称史上最大AI模型OpenAI的1,750亿参数语言
    的头像 发表于 09-25 11:38 2737次阅读
    史上最大<b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>GPT</b>-3你要开始收费了  接下去可能用不起它了

    谷歌开发出一个新的语言模型包含了超过1.6万亿个参数

    AI模型GPT-3。GPT-3就是在570 GB的文本数据上训练的语言模型,因此,就训练数据和生成能力而言,
    的头像 发表于 01-19 15:29 1741次阅读

    Eleuther AI:已经开源了复现版GPT-3的模型参数

    GPT3终于开源!不过,不是官方开的(别打我 Eleuther AI推出的名为GPT-Neo的开源项目,于晨4点于twitter正式宣布:已经开源了复现版GPT-3的
    的头像 发表于 03-31 17:46 2907次阅读

    参天生长大模型:昇腾AI如何强壮模型开发与创新之根?

    自2018年谷歌发布BERT以来,预训练大模型经过几年的发展,以强大的算法效果,席卷了以NLP为代表的各大AI榜单与测试数据集。2020年OpenAI
    的头像 发表于 08-11 09:10 1375次阅读

    ChatGPT升级 OpenAI史上最强大模型GPT-4发布

    ChatGPT升级 史上最强大模型GPT-4发布 OpenAI正式推出了ChatGPT升级版本,号称史上最强大模型
    的头像 发表于 03-15 18:15 2418次阅读

    DeepSpeed结合Megatron-LM训练GPT2模型笔记

    本文基于DeepSpeedExamples仓库中给出的Megatron相关例子探索一下训练GPT2模型的流程。主要包含3个部分,第一个部分是基于原始的Megatron如何训练GPT2
    的头像 发表于 06-19 14:45 1926次阅读
    DeepSpeed结合Megatron-LM训练<b class='flag-5'>GPT2</b><b class='flag-5'>模型</b>笔记

    OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!

    目前为止,OpenAI还没有对爆料中的传闻做出回应,但此前发布过多模态模型测试。CEO奥特曼在回应有关GPT-5的传闻时,也暗示过GPT-4
    的头像 发表于 09-20 17:34 854次阅读
    <b class='flag-5'>OpenAI</b>最新大<b class='flag-5'>模型</b>曝光!剑指多模态,<b class='flag-5'>GPT</b>-4之后最大升级!

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3 目前OpenAI算是全球大
    的头像 发表于 11-07 18:20 2157次阅读
    ChatGPT重磅更新 <b class='flag-5'>OpenAI</b><b class='flag-5'>发布</b><b class='flag-5'>GPT</b>-4 Turbo<b class='flag-5'>模型</b>价格大降2/3

    OpenAI发布文生视频大模型Sora、英伟达市值超谷歌

    OpenAI加入文生视频大模型的战局,AI模型进入视频生成的阶段,这将进一步刺激AI芯片的需求。 Op
    的头像 发表于 03-28 18:13 519次阅读

    微软Copilot全面更新为OpenAIGPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓越的GP
    的头像 发表于 03-13 13:42 245次阅读