0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌开发出一个新的语言模型,包含了超过1.6万亿个参数

ss 来源:陈述根本 作者:陈根 2021-01-19 15:29 次阅读

开发人工智能的语言模型,一直是人工智能的重要细分领域。人工智能语言模型应用包括搜索引擎、文字生成、个性化的对话工具以及软件生成等。

2020年5月,OpenAI的一组研究人员发布了具有里程碑意义的AI模型GPT-3。GPT-3就是在570 GB的文本数据上训练的语言模型,因此,就训练数据和生成能力而言,GPT-3截至2020年都是最庞大的公开发布的语言模型。

此外,OpenAI的GPT-3一反之前死守基础研究的思路,将 GPT-3 做成了一个服务,提供可以调用的 OpenAI API,并且向开放了少量体验资格,使得拿到体验资格的业界人士或学者等,开发出了一众惊人的演示。

包括答题、翻译、写文章,甚至是数学计算和编写代码。而由GPT-3所写的文章几乎达到了以假乱真的地步,在 OpenAI 的测试中,人类评估人员也很难判断出这篇新闻的真假,检测准确率仅为 12%。

但现在,谷歌研究人员开发出一个新的语言模型,它包含了超过 1.6 万亿个参数,远超 Open AI 开发的 GTP-3 的规模(1750 亿个参数),成为迄今为止最大规模的人工智能语言模型,比之前谷歌开发过最大的语言模型 T5-XXL 的效率提高了 4 倍。

该语言模型使用 Switch Transformer 方法进行大规模训练,这是一种“稀疏激活”技术,它只使用模型权重的子集或在模型中转换输入数据的参数,以有效降低计算密集度。

尽管在部分实验中,该模型相比规模更小的模型得到了较低分数。但在相同的计算资源下,预训练速度提高了7倍。这些改进扩展到多语言设置中,我们在所有101种语言中测量mT5基本版本的增益。最后,我们通过在“巨大的干净的爬虫语料库”上预先训练多达万亿个参数的模型,提高了语言模型的当前规模,并实现了比T5-XXL模型4倍的加速。

研究人员认为,稀疏性可以在未来赋予该模型在一系列不同媒体下多模态的优势。这也为人工智能语言模型的深入研究提供了更多方向的参考。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26464

    浏览量

    264091
  • 人工智能
    +关注

    关注

    1776

    文章

    43888

    浏览量

    230633
  • 语言模型
    +关注

    关注

    0

    文章

    435

    浏览量

    10057
收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.31】大语言模型:原理与工程实践

    深远影响,尤其在优化业务流程和重塑组织结构方面。然而,在研究和实践过程中,我们遇到了主要挑战:市场上缺乏大语言模型在实际应用方面的资料。现有的资料多聚焦于理论研究,而具体的实践方法
    发表于 03-18 15:49

    【书籍评测活动NO.30】大规模语言模型:从理论到实践

    模型实践和理论研究的过程中,历时8月完成 《大规模语言模型:从理论到实践》 书的撰写。希望这本书能够帮助读者快速入门大
    发表于 03-11 15:16

    谷歌模型合成工具在哪找到

    谷歌模型合成工具可以在谷歌的官方网站或相关的开发者平台上找到。具体地,您可以尝试访问谷歌的AI平台或开发
    的头像 发表于 03-01 18:13 1157次阅读

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架,由
    的头像 发表于 03-01 16:25 245次阅读

    谷歌模型软件有哪些功能

    谷歌模型软件通常指的是谷歌推出的一系列人工智能模型和软件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌
    的头像 发表于 03-01 16:20 210次阅读

    谷歌模型框架是什么?有哪些功能和应用?

    谷歌模型框架(Google Model Framework)并不是一个特定的框架,而是指谷歌开发的一系列软件框架,用于支持机器学习和人工智能的应用。以下是一些与
    的头像 发表于 02-29 18:11 669次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06

    谷歌开源70亿参数语言模型,全方位超越Meta Llama-2?

    基于Gemini打造的开源模型Gemma。   谷歌加入AI模型开源阵营,Gemma横空出世   根据谷歌的介绍,Gemma是由谷歌Deep
    的头像 发表于 02-23 00:15 3101次阅读
    <b class='flag-5'>谷歌</b>开源70亿<b class='flag-5'>参数</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>,全方位超越Meta Llama-2?

    Stability AI推出迄今为止更小、更高效的1.6B语言模型

    Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。
    的头像 发表于 01-23 10:11 301次阅读
    Stability AI推出迄今为止更小、更高效的<b class='flag-5'>1.6</b>B<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    预训练语言模型。该模型最大的特点就是基于以较小的参数规模取得了优秀的性能,根据官网提供的信息,LLaMA的模型
    发表于 12-22 10:18

    AD9767加上LC滤波电路,输出信号包含了比较大的低频振荡怎么改善?

    不加LC高通滤波电路,输出的波形正常,但是如果加上LC滤波电路,则输出信号包含了比较大的低频振荡。 请问各位专家,此电路该如何改善才能正常输出。
    发表于 12-05 06:07

    语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言模型
    的头像 发表于 12-04 15:51 411次阅读

    腾讯发布混元大语言模型

    腾讯发布混元大语言模型 腾讯全球数字生态大会上腾讯正式发布了混元大语言模型参数规模超千亿,预训练语料超2
    的头像 发表于 09-07 10:23 852次阅读

    盘古大模型参数量有多少

    盘古大模型参数量有多少 盘古大模型(PanGu-α)是由中国科学院计算技术研究所提供的一种语言生成预训练模型。该
    的头像 发表于 08-17 11:28 2061次阅读

    不同设备如何统一语言编程平台高效开发?本文为你揭秘

    HarmonyOS应用。 、什么是ArkCompiler ArkCompiler作为HarmonyOS应用开发的统编程平台,包含编译器、工具链、运行时等关键部件,支持ArkTS、T
    发表于 05-09 10:01