Eleuther AI：已经开源了复现版GPT-3的模型参数-电子发烧友网

GPT3终于开源！不过，不是官方开的（别打我

Eleuther AI推出的名为GPT-Neo的开源项目，于晨4点于twitter正式宣布：已经开源了复现版GPT-3的模型参数（1.3B和2.7B级别），并将其更新在Colab notebook之上。需要指出的是这次开源的模型里较大的那个版本也只是到了GPT-3商用版里最小模型的参数量，不过Eleuther AI表示未来会进一步开源10B版本和原始大小版本的GPT3模型参数。

消息发布后，立刻被各个大v转发，10小时内就已迅速收获1.5K的点赞量，相应的github链接也已收获接近2k star。

▲Twitter原文

但关于复现模型的性能，目前只说“实验表现与原版GPT-3相当”（they perf ormed on par）。具体实验结果将于明天公布。

风靡一时的拥有1750亿超大参数量，一出道便被视作NLP领域最强AI模型的GPT-3，得益于其庞大的参数量，使得GPT-3拥有不用接受特定训练与微调，就能在不同NLP领域达到领先水平的强大能力。去年七月，GPT-3被Open-AI以商业API的形式向公众开放，并被人们探索出了形形色色的应用，从基于问题的搜索，到文本样式转换，从UI界面设计，再到自动生成SQL代码，GPT-3以其卓越的性能展现了其广阔的应用场景，深度学习之父Hinton甚至这样评价道:

如果以GPT-3的出色性能推算未来、生命、宇宙和万物的答案也不过是4.398万亿个参数

但是，由于目前GPT-3的使用模式仍然是付费的商业API，因此并不是所有NLP的研究者都能使用GPT-3完成自己领域的任务与工作。而由Connor Leahy，Leo Gao和Sid Black三人联合创立的Eleuther AI的团队，于去年11月宣布推出GPT-Neo的开源项目，该项目基于GPT系列的设计原理，旨在复现GPT系列的各种项目，在该项目发布之初，其团队成员已经预测可以完成GPT-3级别大小的语言模型。

毫无疑问，GPT-3的开源将会催生出一大批NLP技术的崭新应用，也会以更为低廉的成本释放人们对NLP未来的想象力。

原文标题：【GPT-3】千呼万唤始出来——GPT-3终于开源！

文章出处：【微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

责任编辑:haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
26363

浏览量
263947
开源

开源

+关注

关注
3

文章
2982

浏览量
41694
nlp

nlp

+关注

关注
1

文章
463

浏览量
21812

原文标题：【GPT-3】千呼万唤始出来——GPT-3终于开源！

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

Meta推出最强开源模型Llama 3 要挑战GPT

Meta推出最强开源模型Llama 3 要挑战GPT Facebook母公司Meta Platforms（META.US）推出了开源AI大

发表于 04-19 17:00 •200次阅读

为什么GPU适用于AI？AI服务器产业链格局分析

GPT模型对比BERT模型、T5模型的参数量有明显提升。GPT-3是目前最大的知名语言

发表于 04-09 10:38 •91次阅读

为什么GPU适用于<b class='flag-5'>AI</b>？<b class='flag-5'>AI</b>服务器产业链格局分析

微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

起初，Copilot作为Bing Chat AI助手推出，初期采用GPT-3.5模型，随后升级至GPT-4取得显著进步，如今再次更新至性能卓越的GP

发表于 03-13 13:42 •232次阅读

Rambus HBM3内存控制器IP速率达到9.6 Gbps

在人工智能大模型浪潮的推动下，AI训练数据集正极速扩增。以ChatGPT为例，去年11月发布的GPT-3，使用1750亿个参数构建，今年3月发布的G

发表于 01-23 11:19 •468次阅读

【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

和1750亿参数的GPT-3都是非常由有竞争力的 MetaAI研究人员认为，当前大模型的高成本阻碍了学术研究，因此，开发出这个更小更强的模型

发表于 12-22 10:18

大语言模型简介：基于大语言模型模型全家桶Amazon Bedrock

本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶：Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数（B+）的预训练

发表于 12-04 15:51 •401次阅读

盘古大模型和GPT3有哪些不同

盘古大模型和GPT3有哪些不同盘古大模型和GPT-3都是人工智能领域迈出的重要一步，它们的发展对于人工智能领域的发展都起到了重要的推动作用。但是，盘古大

发表于 08-30 18:28 •1333次阅读

chatGPT和GPT4有什么区别

。它的前身是GPT-1，随后的版本有GPT-2、GPT-3和最新的GPT-4。 GPT-4与之前的版本相比，预计将会有很多改进和变化。尽管该

发表于 08-09 15:18 •1757次阅读

AI大模型的开源算法介绍

自定义。 AI大模型的开源算法简单来说就是用于训练AI大模型的算法，并且是开源的。现阶段随着计

发表于 08-08 17:25 •1345次阅读

对话Moka李国兴：大模型改造SaaS需要持续渐进式创新，先发者把握先机

更多SaaS公司在借助大模型全新的能力进行产业创新应用探索，比如，Notion就基于OpenAI 的GPT-3 开源模型，推出了Notion AI

发表于 07-10 15:33 •216次阅读

GPT-4已经会自己设计芯片了吗？

GPT-4已经会自己设计芯片了！芯片设计行业的一个老大难问题HDL，已经被GPT-4顺利解决。并且，它设计的130nm芯片，已经成功流片

发表于 06-20 11:51 •594次阅读

MEANEST家庭自动化AI（使用GPT-3）

电子发烧友网站提供《MEANEST家庭自动化AI（使用GPT-3）.zip》资料免费下载

发表于 06-15 11:33 •0次下载

最新、最强大的模型GPT-4将向美国政府机构开放

最新、最强大的模型GPT-4将向美国政府机构开放此前微软已向其商业客户提供了OpenAI模型，现在微软宣布将向azure government云计算客户开放openai的人工智能模型

发表于 06-08 20:15 •1210次阅读

技术与市场：AI大模型的“Linux时刻”降临

LLaMA 包括四个不同的参数版本（70 亿/130 亿/330 亿/650 亿），不支持商用，指令数据集基于 OpenAI，模型表现可与 GPT-3 持平或优于 GPT-3。其中，

发表于 06-01 16:43 •1153次阅读

ChatGPT系统开发AI人功智能方案

解决的问题和应用场景，例如智能客服、智能助手等。数据集准备：准备与应用场景相关的数据集，并将其清理、标注、整合等处理，以便为模型提供有效的训练数据。 1.下面是对接gpt的一些请求参数和返回参

发表于 05-18 10:16