0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌开发出一个新的语言模型,包含了超过1.6万亿个参数

ss 来源:陈述根本 作者:陈根 2021-01-19 15:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

开发人工智能的语言模型,一直是人工智能的重要细分领域。人工智能语言模型应用包括搜索引擎、文字生成、个性化的对话工具以及软件生成等。

2020年5月,OpenAI的一组研究人员发布了具有里程碑意义的AI模型GPT-3。GPT-3就是在570 GB的文本数据上训练的语言模型,因此,就训练数据和生成能力而言,GPT-3截至2020年都是最庞大的公开发布的语言模型。

此外,OpenAI的GPT-3一反之前死守基础研究的思路,将 GPT-3 做成了一个服务,提供可以调用的 OpenAI API,并且向开放了少量体验资格,使得拿到体验资格的业界人士或学者等,开发出了一众惊人的演示。

包括答题、翻译、写文章,甚至是数学计算和编写代码。而由GPT-3所写的文章几乎达到了以假乱真的地步,在 OpenAI 的测试中,人类评估人员也很难判断出这篇新闻的真假,检测准确率仅为 12%。

但现在,谷歌研究人员开发出一个新的语言模型,它包含了超过 1.6 万亿个参数,远超 Open AI 开发的 GTP-3 的规模(1750 亿个参数),成为迄今为止最大规模的人工智能语言模型,比之前谷歌开发过最大的语言模型 T5-XXL 的效率提高了 4 倍。

该语言模型使用 Switch Transformer 方法进行大规模训练,这是一种“稀疏激活”技术,它只使用模型权重的子集或在模型中转换输入数据的参数,以有效降低计算密集度。

尽管在部分实验中,该模型相比规模更小的模型得到了较低分数。但在相同的计算资源下,预训练速度提高了7倍。这些改进扩展到多语言设置中,我们在所有101种语言中测量mT5基本版本的增益。最后,我们通过在“巨大的干净的爬虫语料库”上预先训练多达万亿个参数的模型,提高了语言模型的当前规模,并实现了比T5-XXL模型4倍的加速。

研究人员认为,稀疏性可以在未来赋予该模型在一系列不同媒体下多模态的优势。这也为人工智能语言模型的深入研究提供了更多方向的参考。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41156

    浏览量

    302617
  • 人工智能
    +关注

    关注

    1820

    文章

    50335

    浏览量

    266974
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11343
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工作流大模型节点说明

    模型节点是平台提供的基础节点之开发者可以在该节点使用大语言模型处理任务。 节点说明 大模型
    发表于 03-19 14:56

    《当 MCU 原厂的型号超过 100 ,会发生什么?》

    当 MCU 型号只有几十时, 很多问题是感知不到的。 但超过 100 ,变化会非常明显。 第件事:复制开始失效 简单复制配置: 会
    发表于 02-27 10:04

    嵌入式开发是否会成为下一个被看好的领域?

    聊嵌入式开发会不会成为下一个风口,现在确实是挺热门的话题。各种论坛、投资报告都在讲物联网、智能硬件、AIoT的万亿市场,仿佛只要跟嵌入式沾边,就能乘着东风起飞。但如果套用我们刚才聊的
    的头像 发表于 02-26 09:56 652次阅读
    嵌入式<b class='flag-5'>开发</b>是否会成为下<b class='flag-5'>一个</b>被看好的领域?

    什么是大模型,智能体...?大模型100问,快速全面了解!

    、概念篇1.什么是大模型?大模型是指参数规模巨大(通常达到数十亿甚至万亿级别)、使用海量数据训练而成的人工智能
    的头像 发表于 02-02 16:36 1134次阅读
    什么是大<b class='flag-5'>模型</b>,智能体...?大<b class='flag-5'>模型</b>100问,快速全面了解!

    C语言与C++的区别及联系

    创建源文件时什么都不给,默认是.cpp。 3、返回值 C语言中,如果函数没有指定返回值类型,默认返回int类型;C++中,如果
    发表于 12-24 07:23

    谷歌与耶鲁大学合作发布最新C2S-Scale 27B模型

    我们很荣幸发布与耶鲁大学合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),这是新的 270 亿参数基础模型,旨在理解单个细胞的 "
    的头像 发表于 11-06 10:35 1026次阅读

    文读懂大模型常见的10核心概念

    这些常见的专业术语,你又了解多少?这篇文章将帮助你快速掌握AI行业常见的核心概念。1、大模型型号每个大模型都有其独特的设计和功能,有些大模型可能在语言理解方面表现出
    的头像 发表于 09-22 17:02 1382次阅读
    <b class='flag-5'>一</b>文读懂大<b class='flag-5'>模型</b>常见的10<b class='flag-5'>个</b>核心概念

    谷歌AI模型点亮开发无限可能

    在 2025 年的 Google 谷歌开发者大会上,AI 不是门“技术”,更是股彻底改变开发范式的“力量”,助力
    的头像 发表于 08-29 09:29 1308次阅读

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数模型 ‌Kimi K2‌ 在 ‌GroqCl
    的头像 发表于 08-07 10:01 1337次阅读

    面向万亿参数模型,“超节点”涌现

    UniPoD系列超节点产品,旨在为万亿参数模型的训练与推理提供更强劲、更智能且更绿色的算力支持。   H3C UniPoD系列超节点产品基于领先的Scale-up南向互联技术,可实现单机柜最高64卡GPU间的高速互联互通,
    的头像 发表于 08-03 02:37 9139次阅读
    面向<b class='flag-5'>万亿</b>级<b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>,“超节点”涌现

    【HZ-T536开发板免费体验】3 - Cangjie Magic调用视觉语言模型(VLM)真香,是不是可以没有YOLO和OCR了?

    Sampling)全面提升模型能力, 达到 10B 参数级别的视觉语言模型的最强性能,在18榜单任务中持平甚至
    发表于 08-01 22:15

    利用自压缩实现大型语言模型高效缩减

    随着语言模型规模日益庞大,设备端推理变得越来越缓慢且耗能巨大。直接且效果出人意料的解决方案是剪除那些对任务贡献甚微的完整通道(channel)。我们早期的研究提出了
    的头像 发表于 07-28 09:36 653次阅读
    利用自压缩实现大型<b class='flag-5'>语言</b><b class='flag-5'>模型</b>高效缩减

    万亿参数!元脑企智体机率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ -- 浪潮信息宣布元脑企智体机已率先完成对Kimi K2 万亿参数模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户
    的头像 发表于 07-22 09:27 697次阅读
    <b class='flag-5'>万亿</b><b class='flag-5'>参数</b>!元脑企智<b class='flag-5'>一</b>体机率先支持Kimi K2大<b class='flag-5'>模型</b>

    如何将FA模型开发的声明式范式应用切换到Stage模型

    模型切换概述 本文介绍如何将FA模型开发的声明式范式应用切换到Stage模型,您需要完成如
    发表于 06-04 06:22

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型(LLM)的开发已经成为热门话题。这些模型通过学习大量的文本
    的头像 发表于 04-30 18:34 1449次阅读
    小白学大<b class='flag-5'>模型</b>:从零实现 LLM<b class='flag-5'>语言</b><b class='flag-5'>模型</b>