0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型参数达百万亿级别,AI商业化进程加速!

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-02-26 00:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)大模型,又称为预训练模型、基础模型等,大模型通常是在大规模无标注数据上进行训练,学习出一种特征和规则。近期火爆的ChatGPT,便是基于GPT大模型的一个自然语言处理工具。

从参数规模上看,AI大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,参数量实现了从亿级到百万亿级的突破。从模态支持上看,AI大模型从支持图片、图像、文本、语音单一模态下的单一任务,逐渐发展为支持多种模态下的多种任务。

AI大模型的发展历程

AI大模型的发展,还要从2017年Vaswani等提出Transformer架构说起,Transformer架构的提出奠定了当前大模型领域主流的算法架构基础。

2018年,谷歌提出了大规模预训练语言模型BERT,该模型是基于Transformer的双向深层预训练模型,其参数首次超过3亿规模;同年,OpenAI提出了生成式预训练Transformer模型GPT,大大地推动了自然语言处理领域的发展。此后,基于BERT的改进模型、ELNet、RoBERTa、T5等大量新式预训练语言模型不断涌现,预训练技术在自然语言处理领域蓬勃发展。

2019年,OpenAI继续推出15亿参数的GPT-2,能够生成连贯的文本段落,做到初步的阅读理解、机器翻译等。紧接着,英伟达推出了83亿参数的Megatron-LM,谷歌推出了110亿参数的T5,微软推出了170亿参数的图灵Turing-NLG。

2020年,OpenAI推出了超大规模语言训练模型GPT-3,参数达到1750亿,在两年左右的时间实现了模型规模从亿级到上千亿级的突破,并能够实现作诗、聊天、生成代码等功能。此后,微软和英伟达在2020年10月联手发布了5300亿参数的MegatronTuring自然语言生成模型(MT-NLG)。

2021年1月,谷歌推出的Switch Transformer模型以高达1.6万亿的参数量成为史上首个万亿级语言模型;到2022年一大批大模型涌现,比如Stability AI发布的文字到图像的创新模型Diffusion,以及OpenAI推出的ChatGPT。

在国内,大模型研究发展迅速。2021年,商汤发布了书生(INTERN)大模型,拥有100亿的参数量;2021年4月,华为云联合循环智能发布盘古NLP超大规模预训练语言模型,参数规模达1000亿,联合北京大学发布盘古α超大规模预训练模型,参数规模达2000亿。

同年4月,阿里达摩院发布270亿参数的中文预训练语言模型PLUG,联合清华大学发布参数规模达到 1000亿的中文多模态预训练模型M6;7月,百度推出ERNIE 3.0知识增强大模型,参数规模达到百亿;10月,浪潮信息发布约2500亿的超大规模预训练模型“源 1.0”;12月,百度推出ERNIE 3.0 Titan模型,参数规模达2600亿。

2022 年,基于清华大学、阿里达摩院等研究成果以及超算基础实现的“脑级人工智能模型”八卦炉(BAGUALU)完成建立,其模型参数规模突破了174万亿个。可以看到,目前大模型参数规模最高已经达到百万亿级别。

大模型研究的重要意义

当前人工智能正处在可以用到好用的落地阶段,但目前仍处于商业落地早期,主要面临着场景需求碎片化、人力研发和应用计算成本高、长尾场景数据较少导致模型训练精度不够、模型算法从实验室场景到真实场景效果差距大等行业痛点。

大模型具备大规模和预训练的特点,一方面有良好的通用性、泛化性,能够解决传统AI应用中门槛高、部署难的问题,另一方面可以作为技术底座,支撑智能化产品及应用落地。

过去很多年,虽然各大科技公司不断推出较大规模的模型,然而直到去年生成式AI逐渐走向商业化,以及去年底今年初OpenAI推出的ChatGPT爆火,AI大模型才真正迎来发展的转折点。美国国家工程院外籍院士、北京智源人工智能研究院理事张宏江此前表示,ChatGPT和AIGC,技术爆火背后,代表着人工智能(AI)大模型进入一个新的技术范式,也是第三波AI浪潮经过十几年发展之后一个非常重要的拐点。

张宏江认为,它其实代表着从以前各自研发专用小模型到研发超大规模通用智能模型的一个范式转变。这个转变的重要意义在于:通过这种比较先进的算法架构,尽可能多的数据,汇集大量算力,集约化的训练达模式,从而供大量用户使用。

大模型的发展很可能会改变信息产业的格局,改变以前作坊式AI开发模式,把AI应用带入基于互联网、云计算的大规模智能云阶段。

小结

虽然过去十几年人工智能技术发展迅速,然而在近几年却遇到了一些技术瓶颈和商业化难题。而大模型的发展和普及,尤其是通过大模型+微调的新技术开发范式,人工智能将能够更好的在各种场景中实现应用,当然大模型的训练和推理对算力等也提出了很高的要求,因此大模型的研究最终能够如何推进人工智能产业的发展,还需要产业链各环节的共同努力。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42612

    浏览量

    303528
  • ChatGPT
    +关注

    关注

    31

    文章

    1611

    浏览量

    10504
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智行者科技发布物理AI世界模型TransWorld

    6月1日,智行者宣布公司全无人物理AI商业化运营里程累计突破1.6亿公里,迎来新的里程碑。与此同时,更为重磅的是,基于这一混合复杂物理场景的大规模数据沉淀,智行者同步官宣物理AI世界模型
    的头像 发表于 06-02 17:40 1003次阅读

    AI Ceph 分布式存储教程资料大模型学习资料2026

    在人工智能的浪潮中,算力、算法与数据被誉为三驾马车。然而,随着大模型(LLM)参数量突破万亿级别,数据集规模膨胀至 PB 乃至 EB 级别
    发表于 05-01 17:35

    HM博学谷狂野AI模型第四期

    ,虽然能快速构建原型,却难以触及智能的边界。面对模型的幻觉、推理能力的瓶颈以及定制需求的落空,单纯的应用层知识显得苍白无力。博学谷“狂野 AI模型第四期”正是为了打破这一层技术天
    发表于 05-01 17:30

    华为鸿蒙AI眼镜:重构智能穿戴生态,加速电子产品AI进程

    近日,华为正式发布首款深度融入鸿蒙生态的AI眼镜,以光学核心技术的突破与鸿蒙系统的全场景协同能力,推动AI眼镜从“概念验证”迈向“规模落地”,并加速“电子产品
    的头像 发表于 04-28 10:25 5173次阅读

    AI模型微调企业项目实战课

    自主可控大模型:企业微调实战课,筑牢未来 AI 底座 在人工智能席卷全球商业版图的今天,企业对大模型(LLM)的态度已经从“新奇观望”转变为“全面拥抱”。然而,随着应用层面的不断深入
    发表于 04-16 18:48

    小马智行在克罗地亚开启欧洲首个商业化Robotaxi服务

    4月8日,小马智行联合自动驾驶出行服务公司Verne及全球出行平台Uber,在克罗地亚首都萨格勒布开启Robotaxi商业化运营,成为欧洲首个面向公众开放的Robotaxi商业化服务。即日起,萨格勒布市民可通过Verne APP预约体验,后续该服务也将接入Uber APP
    的头像 发表于 04-09 11:29 550次阅读

    解读《2026 具身智能行业研究报告》:国产提速,万亿市场加速落地

    的量产交付元年与商业化突破元年,行业彻底告别概念炒作与样品展示阶段,正式迈入规模量产、商业化闭环、国产主导的高速爆发阶段。
    的头像 发表于 03-26 15:59 1277次阅读
    解读《2026 具身智能行业研究报告》:国产<b class='flag-5'>化</b>提速,<b class='flag-5'>万亿</b>市场<b class='flag-5'>加速</b>落地

    “养虾”热潮下窥看深圳AI硬件产品商业化提速

    由智方舟(BLACKARK)联动智品库、智玩店,构筑产业“全生命周期”闭环生态大模型技术从云端加速走向终端,AI硬件产品正迎来从“单点突破”向“系统爆发”的产业拐点。3月16日,一场
    的头像 发表于 03-17 14:18 448次阅读
    “养虾”热潮下窥看深圳<b class='flag-5'>AI</b>硬件产品<b class='flag-5'>商业化</b>提速

    AR眼镜方案亮相国际展会,镭昱单片全彩Micro-LED迈入商业化新阶段

    2026新年伊始,镭昱在Micro-LED微显示领域的商业化进程迎来关键突破——搭载镭昱PowerMatch® 1单片全彩Micro-LED微显示屏的AR眼镜方案,先后亮相CES与SPIE
    的头像 发表于 02-28 16:38 1187次阅读
    AR眼镜方案亮相国际展会,镭昱单片全彩Micro-LED迈入<b class='flag-5'>商业化</b>新阶段

    模型 ai coding 比较

    序 我主要用途是 ai coding,从各种渠道获取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    发表于 02-19 13:43

    迈向吉瓦级AI工厂的能源变革:英伟Rubin平台电源架构解析

    随着人工智能(AI)模型参数量突破万亿级别,从大语言模型(LLM)的训练向推理、以及更高级的代理
    的头像 发表于 01-15 17:42 1194次阅读
    迈向吉瓦级<b class='flag-5'>AI</b>工厂的能源变革:英伟<b class='flag-5'>达</b>Rubin平台电源架构解析

    PIX Moving与泰宇坦行启动城市机器人商业化试点运营

    加速自动驾驶技术在真实商业场景中的价值转化,PIX Moving 近日宣布与运营合作伙伴泰宇坦行(勘设股份控股子公司)达成战略合作,在贵阳市观山湖区正式启动城市机器人商业化试点运营。
    的头像 发表于 01-15 11:32 1065次阅读

    xMEMS完成2100万美元D轮融资,加速突破性piezoMEMS技术在AI消费设备中的商业化进程

    、CDIB-TEN Capital、Harbinger Venture Capital、SIG Asia Investments(海纳国际集团SIG的附属公司)及其他战略投资者跟投。 新资金将用于加速xMEMS基于piezoMEMS的扬声器和微型散热芯片的量产与全球商业化
    的头像 发表于 11-07 10:45 1057次阅读
    xMEMS完成2100万美元D轮融资,<b class='flag-5'>加速</b>突破性piezoMEMS技术在<b class='flag-5'>AI</b>消费设备中的<b class='flag-5'>商业化</b><b class='flag-5'>进程</b>

    企创科技与天罡智算合作再升级,独家运营模型市场赋能AI应用高效商业化

    重要升级。在既有品牌战略合作基础上,企创科技正式成为天罡智算平台"AI模型市场"的独家运营商,此标志着双方合作从品牌层面深化至业务运营核心,共同为人工智能企业打造从市场推广到商业转化的完整闭环服务。 一、强强联合,构建
    的头像 发表于 10-22 13:43 318次阅读
    企创科技与天罡智算合作再升级,独家运营<b class='flag-5'>模型</b>市场赋能<b class='flag-5'>AI</b>应用高效<b class='flag-5'>商业化</b>

    从续航焦虑到安全飞行:增程式技术如何推动eVTOL商业化落地

    在低空经济加速发展的背景下,电动垂直起降飞行器(eVTOL)的商业化进程面临核心挑战——续航能力和动力可靠性。纯电推进系统受限于当前电池能量密度,难以满足中远程飞行需求,而增程式发电系统
    的头像 发表于 09-25 11:25 1493次阅读
    从续航焦虑到安全飞行:增程式技术如何推动eVTOL<b class='flag-5'>商业化</b>落地