0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

挑战千亿模型参数!1.4秒预报全球天气!华为重磅发布盘古大模型3.0

章鹰观察 来源:电子发烧友网 作者:章鹰 2023-07-09 12:13 次阅读

电子发烧友原创 章鹰

7月7日,华为开发者大会在东莞松山湖正式揭开帷幕,华为常务董事、华为云CEO张平安在下午举行的主题会议上,正式重磅发布盘古大模型3.0。张平安表示:“盘古大模型不会做诗只会做事。它要帮助各行各业,在各个领域让AI赋予价值,在矿山、金融、政务、气象,我们有很多的工作小组派下去,为各个行业赋予价值。我们坚持的方向,AIforindustry。”

wKgZomSqNPiAA-zFAAf9Xb9Y7TQ192.png 
图:华为常务董事、华为云CEO张平安


2023年,中国的AI团队开始密集发布各种大模型,从3月开启到7月就有七款大模型发布,清华智谱AI研发的GLM-1308在3月14日开启内测; 百度于3月 16 日推出了其最新的生成式人工智能产品和知识增强型大语言模型文心一言;4月10日商汤公布“日日新Sensenova”;阿里4月11日推出大语言模型“通义千问”;科大讯飞在5月6日推出星火认知大模型V1.0版本;时隔一个月,6月9日又推出星火大模型V1.5版;到7月6日,2023世界人工智能大会在上海开幕,中国电信发布大语言模型Telechat。在这届大会的“迈向通用人工智能”主题展区,集中展示了国内外的30多款大模型。可以说大模型卷起来了。

wKgaomSqNQWAOR8UAALPZ1vXW08479.png 
图:电子发烧友根据公开资料整理


华为云推出的盘古大模型3.0的架构有何精妙之处?在从通用人工智能迈向行业人工智能,走深向实的道路上,华为云的盘古云大模型3.0有哪些接地气的行业应用?在气象预报领域,盘古云大模型研发团队的研发成果为何能登上国际一流期刊《自然》(Nature)杂志?发布会的现场揭示了许多核心疑问。

聚焦行业应用,盘古大模型推出“5+N+X”三层架构

“今年上半年,国内厂商发布了80多个AI大模型,我们注意到这些大模型发布后都具有非常好的对话能力,文案生成能力,很多大模型都会做诗,有的大模型甚至都会作画。华为盘古大模型不会写诗,只会做事,盘古大模型需要扎根行业,为各个行业带来价值。”华为云CEO张平安强调说。

“我们发现当前通用的大模型落地行业应用存在三大挑战:1、大模型通用性强,但专业性弱,落地行业需要专业知识,了解行业的工作流程,给出专业回答;2、大模型知识多,但是技能不足;3、数据是企业的核心资产之一,大模型可以有效的存储和挖掘知识,在训练和使用大模型需要保证企业数据的安全合规。” 华为云人工智能领域首席科学家田奇表示。

为了应对这些挑战,华为将盘古大模型3.0定位为面向行业的大模型系列,包括“5+N+X”三层架构。

wKgZomSqNRKAMIfYAAe5zcOkjmQ476.png

L0层的盘古基础大模型,包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。

L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。

L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。

在煤矿领域,企业用户通过盘古视觉大模型,识别采掘过程中的大块的煤和大块的岩石。山东能源集团及其技术公司云鼎科技,已经和华为深度合作,开发了21个场景化的应用,覆盖了7大业务系统。盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。

在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。检测效率提升20倍。

wKgaomSqNR-AMs-8AAfneJVl7XA794.png

“原来传统方式预测10天台风的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。”张平安表示,“今年5月份,中国气象局和盘古进行了合作,预测玛娃台风路径,盘古提前10天精确预测玛娃台风的路径,盘古预测的速度和精度已明显优于传统的方法。在刚刚结束的第19届世界气象大会上,欧洲气象局也指出,华为云盘古气象大模型在精度上有不可否认的能力,对2月份芬兰寒潮的预测,比欧洲的预测方法提前2天,温度预测更加接近实际发生的温度。”

盘古气象大模型的最新成果刚刚登上Nature正刊,只需要1.4秒就能完成24小时全球气象预报。

扎根AI根技术,实现行业大模型做到四大关键点

盘古大模型3.0最底层的基础大模型包括100亿参数、380亿参数、710亿参数和1000亿参数四个版本,预训练使用了超3万亿tokens。

“要适配行业的不同场景,就必须做完全的解耦。我们将大模型和能力层解耦之后,不管你使用的是380亿参数的模型,还是1000亿参数的模型,能力级是不变的,是一致的。预测的大模型可以调用能力集,科学大模型也可以调用多模态能力。”张平安指出。

wKgZomSqNSuASyb_AAnoVEiqjtA462.png 
华为云人工智能领域首席科学家田奇介绍如何从基础大模型炼成行业大模型

“盘古大模型基础层L0层,我们做了上百种能力,包括语言模型的实时问答,文案生成能力,视觉模型的检测分割,三维重建能力,多模态模型的文生图能力,以及模型编排和插件等高阶能力。盘古大模型的各项能力能够做到解耦和按需组合,企业客户可以根据具体的场景需求选择所需要的数据集,使用盘古大模型工作流,快速开发行业大模型性能力。” 华为云人工智能领域首席科学家田奇表示。

实现行业大模型的四大关键点,田奇分析指出:一是沉淀行业知识;二是淬炼行业技能,结合专家和行业数字环境的反馈进行强化学习,以达到符合行业应用的最佳结果;三是对话专业工具,除了人与机器的对话,我们更多解决的是机器与机器,机器与工具的对话,将大模型与业务系统进行融合,产生对话和交流,让大模型可以调用大量的行业资产和工具;四是保证安全合规,盘古提供公有云、混合云大模型专区,这三种模式保证安全部署。建立长效机制,确保大模型安全合规,包括数据集来源和使用合规,数据全生命周期安全,构建完整的数据标注以及审核机制,构建模型合规使用的政策,确保大模型的使用边界。

华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。

张平安还宣布,单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。同时,这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。

小结:

行业专家强调AI赋能千行百业,行业大模型非常重要。通用大模型有很强的能力,但并不能解决很多企业的具体问题。企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型构建自己的专属模型,也许是企业更优的选项。

盘古大模型3.0已经开始在10多个行业践行智能化的能力,目前国内在金融、政府、教育、电信、能源领域,多家公司已经发布了行业大模型,竞争日益激烈,具体客户是否能为华为云、百度云、科大讯飞等公司推出的行业大模型买单,关键还要看各家迭代的模型在实际应用当中的应用效果和价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    215

    文章

    33637

    浏览量

    247171
  • 大模型
    +关注

    关注

    2

    文章

    1543

    浏览量

    1139
  • 盘古大模型
    +关注

    关注

    1

    文章

    99

    浏览量

    107
收藏 人收藏

    评论

    相关推荐

    盘古模型:能否撑起世界AI另一极?

    2023 华为开发者大会(HDC 2023)开幕。下午两个多小时的主题演讲里,华为云首次详细披露了盘古模型的进展,不仅发布面向行业的
    的头像 发表于 09-05 15:15 789次阅读

    华为盘古模型华为鲲鹏的区别在哪

    华为云正式发布盘古模型3.0盘古模型
    的头像 发表于 09-04 15:12 1867次阅读

    华为盘古模型是什么东西 华为盘古模型应用的案例

    华为开发者大会上发布盘古模型3.0是一个完全面向行业的大模型系列,包含了多个基础大
    的头像 发表于 08-31 12:24 3933次阅读

    华为盘古模型预期怎么样 华为盘古模型需要光模块吗

    华为盘古模型预期怎么样 华为盘古模型需要光模块吗  华为
    的头像 发表于 08-31 10:20 2020次阅读

    华为盘古ai个人可以用吗 盘古模型好用吗

    华为盘古ai个人可以用吗 盘古模型好用吗  华为盘古AI是一款人工智能产品,由
    的头像 发表于 08-31 10:10 4322次阅读

    华为盘古是什么意思?盘古模型怎么用?

    华为盘古是什么意思?盘古模型怎么用? 华为盘古华为
    的头像 发表于 08-30 17:26 1.8w次阅读

    最强科普!深度解析华为盘古模型

    在美丽的华为欧洲小镇 有大事儿发生! 全栈自主的AI大模型——盘古模型3.0正式发布 这是一个
    的头像 发表于 07-14 15:20 1390次阅读

    软通动力成为华为盘古模型首批合作伙伴

    7月7日,华为开发者大会2023(Cloud)在东莞正式拉开帷幕。在首日主题演讲“一切皆服务,AI重塑千行百业”中,华为重磅发布华为盘古
    的头像 发表于 07-08 20:50 1087次阅读
    软通动力成为<b class='flag-5'>华为</b>云<b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b>首批合作伙伴

    华为盘古模型3.0发布,软通动力参与其中

    创新实践精彩亮相,并将广泛参与论坛、圆桌等环节,就热门技术话题展开深入交流和分享。 开放同飞  共享大模型价值和机遇 在 “一切皆服务,AI重塑千行百业”大会主题演讲中,华为常务董事、华为云CEO张平安
    的头像 发表于 07-07 23:25 1065次阅读
    <b class='flag-5'>华为</b>云<b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b><b class='flag-5'>3.0</b><b class='flag-5'>发布</b>,软通动力参与其中

    AI重塑千行百业 华为发布盘古模型3.0和昇腾AI云服务

    7月7日下午,华为常务董事、华为云CEO张平安重磅发布盘古模型
    的头像 发表于 07-07 17:39 1588次阅读
    AI重塑千行百业 <b class='flag-5'>华为</b>云<b class='flag-5'>发布</b><b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b><b class='flag-5'>3.0</b>和昇腾AI云服务

    华为发布盘古模型3.0华为盘古模型将迎重大升级

    盘古模型基于华为自研的MindSpore框架开发,参数最多可达1.085万亿。此前,盘古模型
    的头像 发表于 07-07 16:33 1604次阅读

    华为盘古模型3.0发布,一个完全面向行业的大模型

    华为盘古模型3.0正式发布引发全球AI产业震荡,张平安称,
    的头像 发表于 07-07 16:30 1407次阅读

    华为盘古模型3.0正式发布,大模型系列架构汇总

    盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系
    的头像 发表于 07-07 16:16 1267次阅读

    华为盘古模型发布时间,华为盘古模型3.0正式发布

    7月7日,华为云正式发布盘古模型3.0,建立业界首个万卡AI集群,欲打造世界AI另一极!盘古
    的头像 发表于 07-07 16:08 1623次阅读

    华为重磅发布盘古模型3.0

    今天,华为开发者大会2023(Cloud)在中国东莞正式揭开帷幕。在下午举行的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布
    的头像 发表于 07-07 15:35 863次阅读
    <b class='flag-5'>华为</b>云<b class='flag-5'>重磅</b><b class='flag-5'>发布</b><b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b><b class='flag-5'>3.0</b>