0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

史上最大AI模型GPT-3强势霸榜Github

人工智能与大数据技术 来源:开源最前线 作者:开源最前线 2021-01-06 17:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近,GPT-3火了!相信你已经在网上看到各种有关GPT-3的演示。这个由OpenAI创建的大型机器学习模型,它不仅可以自己写论文,还会写诗歌,就连你写的代码都能帮你写了。 下面还是先让你看看GPT-3的威力吧,首先来看看GPT3在问答任务上的表现:

4139cfac-4ff9-11eb-8b86-12bb97331649.png

无论你的问题是天马行空的脑筋急转弯,还是有逻辑性极强的数学问题,它都能对答如流。 开发者Sharif Shameem用GPT-3做了一个生成器,你只要输入你所需的布局,它就能为你生成JSX代码。如下视频所示:

还有人在 Google 表格里开发了一个新的 GPT3 函数,除了简单的数学运算之外,它还可以自动查找美国各州的人口以及创建年份:

41764a68-4ff9-11eb-8b86-12bb97331649.png

除此之外,它还能查到Twitter账号:

41b126d8-4ff9-11eb-8b86-12bb97331649.png

遗憾的是,如果你想试用GPT-3,你得先拿到体验资格才行,但是此模型创建的应用程序似乎有无限可能,通过它你可以使用纯英语查询SQL数据库,自动注释代码,自动生成代码,编写热门文章标题,甚至帮助猿妹我写出一篇爆文。 GPT-3是什么? GPT-3是一种神经网络驱动的语言模型。与大多数语言模型一样,GPT-3在未标记的文本数据集上进行了大量的训练(训练数据包括Common Crawl和Wikipedia),从文本中随机删除单词或短语,并且模型必须学会仅使用周围的单词作为上下文来填充单词或短语。这是一个简单的培训任务,可以产生功能强大且可推广的模型。 GPT-3模型架构本身就是一个基于单向transformer语言模型。这种架构在2-3年前开始流行,流行的NLP模型BERT和GPT-3的前身GPT-2都是基于transformer构建。从架构的角度来看,GPT-3实际上并不是很新颖!

42265afc-4ff9-11eb-8b86-12bb97331649.jpg

它之所以会这么火,是因为GPT-3的模型尺寸增大到了1750亿,并且使用45TB数据进行训练,是有史以来创建的最大语言模型。源于它的参数模型巨大,因此可以完成许多其他模型无法完成的事情,就像前面所说的,你可以让它成为一名翻译家、作家、诗人、程序员等。 如果你对GPT-3的模型参数1750亿感到有些抽象,那么,我举个例子,你应该就懂了:

BERT模型有3亿参数

GPT-3模型的前身GPT-2有15亿个参数

英伟达的Megatron-BERT有80亿参数

微软Turing NLP,有170亿参数

就连排名第二的微软Turing NLP的数据参数和GPT-3都不是一个量级的。

值得一提的是,这次的GPT-3论文作者足足有31位,论文体量更是高达72页,网友都惊呼,现在PTM的工作是要开始pk论文页数了吗?

和往常一样,GPT-3立即放出了GitHub项目页面,你可以在上面找到各种各样有趣的demo,最后附上Github地址:https://github.com/openai/gpt-3。推荐↓↓↓

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38153

    浏览量

    296814
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5震撼发布:AI领域的重大飞跃

    电子发烧友网报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,更以多维度性能
    的头像 发表于 08-09 07:44 9876次阅读
    <b class='flag-5'>GPT</b>-5震撼发布:<b class='flag-5'>AI</b>领域的重大飞跃

    GPT-5.1发布 OpenAI开始拼情商

    -5.1 Thinking:高级推理模型,在简单任务上更快,在复杂任务上更持久,也更容易理解。 对于新上线的GPT-5.1大模型,OpenAI 官方表示出色的 AI 不仅是要够聪明,还
    的头像 发表于 11-13 15:49 553次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    什么是AI模型的推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face 的物理推理模型排行
    的头像 发表于 09-23 15:19 843次阅读

    NVIDIA从云到边缘加速OpenAI gpt-oss模型部署,实现150万TPS推理

      自 2016 年推出 NVIDIA DGX 以来,NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。此次 OpenAI gpt-oss-20b 和 gpt-oss-120b
    的头像 发表于 08-15 20:34 1967次阅读
    NVIDIA从云到边缘加速OpenAI <b class='flag-5'>gpt</b>-oss<b class='flag-5'>模型</b>部署,实现150万TPS推理

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态资源,还
    发表于 04-13 19:52

    低至¥2.27/h!就能使用全球最强开元模型——千问 QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开元模型——千问QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通义千问发布的最新开源推理模型QwQ-32B,在国际权威测评
    的头像 发表于 03-19 12:34 883次阅读
    低至¥2.27/h!就能使用全球最强开元<b class='flag-5'>模型</b>——千问 QwQ-32B

    研华科技利用DeepSeek大模型打造医疗AI智能助手

    AI技术的应用成为医疗行业突破困境的关键。DeepSeek作为近期持续AI应用平台,其开源属性和强大的技术能力,正在深刻改变医疗行业的运作模式。通过智能化手段,不仅可以提高医疗服
    的头像 发表于 02-20 09:40 1793次阅读
    研华科技利用DeepSeek大<b class='flag-5'>模型</b>打造医疗<b class='flag-5'>AI</b>智能助手

    从性能到商业,Grok3GPT-4o、DeepSeek如何重塑AI版图?

    2025年2月,AI领域仿佛上演了一场激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型大放异彩的DeepSeek,三大巨头
    的头像 发表于 02-19 18:14 1563次阅读
    从性能到商业,Grok<b class='flag-5'>3</b>、<b class='flag-5'>GPT</b>-4o、DeepSeek如何重塑<b class='flag-5'>AI</b>版图?

    OpenAI即将发布GPT-4.5与GPT-5

    GPT-4.5将在未来几周内率先亮相,它将是OpenAI通用GPT-4模型的继承者。这款新的算法在技术上进行了诸多优化和升级,旨在为用户提供更加精准、高效的AI服务。 而在
    的头像 发表于 02-13 13:43 1031次阅读

    OpenAI即将推出GPT-5模型

    先进技术,其中包括备受瞩目的o3工具。通过整合这些技术,GPT-5模型将实现更加强大的功能和性能。 值得一提的是,GPT-5模型将被广泛应用
    的头像 发表于 02-13 11:21 915次阅读

    OpenAI将发布更智能GPT模型AI智能体工具

    OpenAI近日透露了其未来发展的重要动向。据OpenAI首席产品官凯文·维尔(Kevin Weil)介绍,公司计划推出更智能的GPT o3模型,并首次亮相AI智能体工具,这将使Cha
    的头像 发表于 01-24 13:54 788次阅读

    发布N1-655前端生成式AI芯片

    Ambarella(下称“安”,纳斯达克股票代码:AMBA,AI 视觉感知芯片公司)在 CES 上发布了 N1-655 前端生成式 AI 芯片(SoC),该芯片可同时处理 12 路 1080p30 视频解码,并且可运行多个多模
    的头像 发表于 01-09 10:29 1494次阅读

    国产大模型DeepSeek推出DeepSeek-V3

    众所周知,过去一年间,大语言模型(LLM)领域经历了翻天覆地的变化... 回望2023年底,OpenAI的GPT-4还是一座难以逾越的高峰,其他AI实验室都在思考同一个问题:OpenAI究竟掌握了
    的头像 发表于 01-06 10:51 4245次阅读
    国产大<b class='flag-5'>模型</b>DeepSeek推出DeepSeek-V<b class='flag-5'>3</b>

    云知声荣登甲子光年“2024中国AI模型领域最具商业潜力

    科技产业投资】三大行业榜单。云知声凭借卓越的技术实力、创新的场景应用以及广阔的市场前景,荣登“2024中国AI模型领域最具商业潜力”。
    的头像 发表于 12-13 14:30 879次阅读