0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

史上最大AI模型GPT-3强势霸榜Github

人工智能与大数据技术 来源:开源最前线 作者:开源最前线 2021-01-06 17:06 次阅读

最近,GPT-3火了!相信你已经在网上看到各种有关GPT-3的演示。这个由OpenAI创建的大型机器学习模型,它不仅可以自己写论文,还会写诗歌,就连你写的代码都能帮你写了。 下面还是先让你看看GPT-3的威力吧,首先来看看GPT3在问答任务上的表现:

4139cfac-4ff9-11eb-8b86-12bb97331649.png

无论你的问题是天马行空的脑筋急转弯,还是有逻辑性极强的数学问题,它都能对答如流。 开发者Sharif Shameem用GPT-3做了一个生成器,你只要输入你所需的布局,它就能为你生成JSX代码。如下视频所示:

还有人在 Google 表格里开发了一个新的 GPT3 函数,除了简单的数学运算之外,它还可以自动查找美国各州的人口以及创建年份:

41764a68-4ff9-11eb-8b86-12bb97331649.png

除此之外,它还能查到Twitter账号:

41b126d8-4ff9-11eb-8b86-12bb97331649.png

遗憾的是,如果你想试用GPT-3,你得先拿到体验资格才行,但是此模型创建的应用程序似乎有无限可能,通过它你可以使用纯英语查询SQL数据库,自动注释代码,自动生成代码,编写热门文章标题,甚至帮助猿妹我写出一篇爆文。 GPT-3是什么? GPT-3是一种神经网络驱动的语言模型。与大多数语言模型一样,GPT-3在未标记的文本数据集上进行了大量的训练(训练数据包括Common Crawl和Wikipedia),从文本中随机删除单词或短语,并且模型必须学会仅使用周围的单词作为上下文来填充单词或短语。这是一个简单的培训任务,可以产生功能强大且可推广的模型。 GPT-3模型架构本身就是一个基于单向transformer语言模型。这种架构在2-3年前开始流行,流行的NLP模型BERT和GPT-3的前身GPT-2都是基于transformer构建。从架构的角度来看,GPT-3实际上并不是很新颖!

42265afc-4ff9-11eb-8b86-12bb97331649.jpg

它之所以会这么火,是因为GPT-3的模型尺寸增大到了1750亿,并且使用45TB数据进行训练,是有史以来创建的最大语言模型。源于它的参数模型巨大,因此可以完成许多其他模型无法完成的事情,就像前面所说的,你可以让它成为一名翻译家、作家、诗人、程序员等。 如果你对GPT-3的模型参数1750亿感到有些抽象,那么,我举个例子,你应该就懂了:

BERT模型有3亿参数

GPT-3模型的前身GPT-2有15亿个参数

英伟达的Megatron-BERT有80亿参数

微软Turing NLP,有170亿参数

就连排名第二的微软Turing NLP的数据参数和GPT-3都不是一个量级的。

值得一提的是,这次的GPT-3论文作者足足有31位,论文体量更是高达72页,网友都惊呼,现在PTM的工作是要开始pk论文页数了吗?

和往常一样,GPT-3立即放出了GitHub项目页面,你可以在上面找到各种各样有趣的demo,最后附上Github地址:https://github.com/openai/gpt-3。推荐↓↓↓

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263957
  • 机器学习
    +关注

    关注

    66

    文章

    8095

    浏览量

    130519

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    为什么GPU适用于AIAI服务器产业链格局分析

    GPT模型对比BERT模型、T5模型的参数量有明显提升。GPT-3是目前最大的知名语言
    发表于 04-09 10:38 94次阅读
    为什么GPU适用于<b class='flag-5'>AI</b>?<b class='flag-5'>AI</b>服务器产业链格局分析

    微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓越的GP
    的头像 发表于 03-13 13:42 232次阅读

    OPPO推出GPT模型手机 搭载天玑9300卷天卷地卷大模型

    OPPO推出GPT模型手机?是的,只能说生成式 AI 实在是太爆火了,智能手机市场的竞争都只能继续卷。 今天OPPO推出 GPT模型
    的头像 发表于 01-08 18:52 694次阅读

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    和1750亿参数的GPT-3都是非常由有竞争力的 MetaAI研究人员认为,当前大模型的高成本阻碍了学术研究,因此,开发出这个更小更强的模型将有利于学术研究的发展。使用较少参数的模型
    发表于 12-22 10:18

    大语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数(B+)的预训练语言模型
    的头像 发表于 12-04 15:51 401次阅读

    500篇论文!最全代码大模型综述

    经典 Transformer 使用不可学习的余弦编码,加在模型底层的词向量输入上。GPT、BERT将其改为可学习的绝对位置编码,并沿用到了RoBERTa、BART、GPT-2、GPT-3
    的头像 发表于 11-17 17:31 598次阅读

    OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!

    目前为止,OpenAI还没有对爆料中的传闻做出回应,但此前发布过多模态模型测试。CEO奥特曼在回应有关GPT-5的传闻时,也暗示过GPT-4“正在增强”。
    的头像 发表于 09-20 17:34 845次阅读
    OpenAI最新大<b class='flag-5'>模型</b>曝光!剑指多模态,<b class='flag-5'>GPT</b>-4之后<b class='flag-5'>最大</b>升级!

    盘古大模型GPT3有哪些不同

    盘古大模型GPT3有哪些不同 盘古大模型GPT-3都是人工智能领域迈出的重要一步,它们的发展对于人工智能领域的发展都起到了重要的推动作用。但是,盘古大
    的头像 发表于 08-30 18:28 1335次阅读

    华为盘古大模型GPT的区别

    华为盘古大模型GPT的区别  随着人工智能技术的不断进步,机器学习领域的研究也越来越深入。在这其中,以自然语言处理技术为主要研究方向的人工智能算法受到了广泛关注。在这个领域中,华为盘古大模型
    的头像 发表于 08-30 17:38 3392次阅读

    chatGPT和GPT4有什么区别

    。它的前身是GPT-1,随后的版本有GPT-2、GPT-3和最新的GPT-4。 GPT-4与之前的版本相比,预计将会有很多改进和变化。尽管该
    的头像 发表于 08-09 15:18 1757次阅读

    对话Moka李国兴:大模型改造SaaS需要持续渐进式创新,先发者把握先机

    更多SaaS公司在借助大模型全新的能力进行产业创新应用探索,比如,Notion就基于OpenAI 的GPT-3 开源模型,推出了Notion AI (Alpha) 写作助手,并将其作为
    的头像 发表于 07-10 15:33 216次阅读

    一文读懂大语言模型

    本文旨在让没有计算机科学背景的人对ChatGPT和类似的人工智能系统(GPT-3GPT-4、Bing Chat、Bard等)的工作原理有一些了解。ChatGPT是一种基于*大语言模型(Large Language Model)
    发表于 06-16 09:59 1091次阅读
    一文读懂大语言<b class='flag-5'>模型</b>

    MEANEST家庭自动化AI(使用GPT-3

    电子发烧友网站提供《MEANEST家庭自动化AI(使用GPT-3).zip》资料免费下载
    发表于 06-15 11:33 0次下载
    MEANEST家庭自动化<b class='flag-5'>AI</b>(使用<b class='flag-5'>GPT-3</b>)

    最新、最强大的模型GPT-4将向美国政府机构开放

    最新、最强大的模型GPT-4将向美国政府机构开放 此前微软已向其商业客户提供了OpenAI模型,现在微软宣布将向azure government云计算客户开放openai的人工智能模型
    的头像 发表于 06-08 20:15 1211次阅读

    技术与市场:AI模型的“Linux时刻”降临

    LLaMA 包括四个不同的参数版本(70 亿/130 亿/330 亿/650 亿),不支持商用,指令数 据集基于 OpenAI,模型表现可与 GPT-3 持平或优于 GPT-3。其中,70 亿和 130 亿参数 版拥有包含 1
    的头像 发表于 06-01 16:43 1153次阅读
    技术与市场:<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>的“Linux时刻”降临