0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

挑战千亿模型参数!1.4秒预报全球天气!华为重磅发布盘古大模型3.0

章鹰观察 来源:电子发烧友网 作者:章鹰 2023-07-09 12:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友原创 章鹰

7月7日,华为开发者大会在东莞松山湖正式揭开帷幕,华为常务董事、华为云CEO张平安在下午举行的主题会议上,正式重磅发布盘古大模型3.0。张平安表示:“盘古大模型不会做诗只会做事。它要帮助各行各业,在各个领域让AI赋予价值,在矿山、金融、政务、气象,我们有很多的工作小组派下去,为各个行业赋予价值。我们坚持的方向,AIforindustry。”

wKgZomSqNPiAA-zFAAf9Xb9Y7TQ192.png 
图:华为常务董事、华为云CEO张平安


2023年,中国的AI团队开始密集发布各种大模型,从3月开启到7月就有七款大模型发布,清华智谱AI研发的GLM-1308在3月14日开启内测; 百度于3月 16 日推出了其最新的生成式人工智能产品和知识增强型大语言模型文心一言;4月10日商汤公布“日日新Sensenova”;阿里4月11日推出大语言模型“通义千问”;科大讯飞在5月6日推出星火认知大模型V1.0版本;时隔一个月,6月9日又推出星火大模型V1.5版;到7月6日,2023世界人工智能大会在上海开幕,中国电信发布大语言模型Telechat。在这届大会的“迈向通用人工智能”主题展区,集中展示了国内外的30多款大模型。可以说大模型卷起来了。

wKgaomSqNQWAOR8UAALPZ1vXW08479.png 
图:电子发烧友根据公开资料整理


华为云推出的盘古大模型3.0的架构有何精妙之处?在从通用人工智能迈向行业人工智能,走深向实的道路上,华为云的盘古云大模型3.0有哪些接地气的行业应用?在气象预报领域,盘古云大模型研发团队的研发成果为何能登上国际一流期刊《自然》(Nature)杂志?发布会的现场揭示了许多核心疑问。

聚焦行业应用,盘古大模型推出“5+N+X”三层架构

“今年上半年,国内厂商发布了80多个AI大模型,我们注意到这些大模型发布后都具有非常好的对话能力,文案生成能力,很多大模型都会做诗,有的大模型甚至都会作画。华为盘古大模型不会写诗,只会做事,盘古大模型需要扎根行业,为各个行业带来价值。”华为云CEO张平安强调说。

“我们发现当前通用的大模型落地行业应用存在三大挑战:1、大模型通用性强,但专业性弱,落地行业需要专业知识,了解行业的工作流程,给出专业回答;2、大模型知识多,但是技能不足;3、数据是企业的核心资产之一,大模型可以有效的存储和挖掘知识,在训练和使用大模型需要保证企业数据的安全合规。” 华为云人工智能领域首席科学家田奇表示。

为了应对这些挑战,华为将盘古大模型3.0定位为面向行业的大模型系列,包括“5+N+X”三层架构。

wKgZomSqNRKAMIfYAAe5zcOkjmQ476.png

L0层的盘古基础大模型,包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。

L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。

L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。

在煤矿领域,企业用户通过盘古视觉大模型,识别采掘过程中的大块的煤和大块的岩石。山东能源集团及其技术公司云鼎科技,已经和华为深度合作,开发了21个场景化的应用,覆盖了7大业务系统。盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。

在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。检测效率提升20倍。

wKgaomSqNR-AMs-8AAfneJVl7XA794.png

“原来传统方式预测10天台风的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。”张平安表示,“今年5月份,中国气象局和盘古进行了合作,预测玛娃台风路径,盘古提前10天精确预测玛娃台风的路径,盘古预测的速度和精度已明显优于传统的方法。在刚刚结束的第19届世界气象大会上,欧洲气象局也指出,华为云盘古气象大模型在精度上有不可否认的能力,对2月份芬兰寒潮的预测,比欧洲的预测方法提前2天,温度预测更加接近实际发生的温度。”

盘古气象大模型的最新成果刚刚登上Nature正刊,只需要1.4秒就能完成24小时全球气象预报。

扎根AI根技术,实现行业大模型做到四大关键点

盘古大模型3.0最底层的基础大模型包括100亿参数、380亿参数、710亿参数和1000亿参数四个版本,预训练使用了超3万亿tokens。

“要适配行业的不同场景,就必须做完全的解耦。我们将大模型和能力层解耦之后,不管你使用的是380亿参数的模型,还是1000亿参数的模型,能力级是不变的,是一致的。预测的大模型可以调用能力集,科学大模型也可以调用多模态能力。”张平安指出。

wKgZomSqNSuASyb_AAnoVEiqjtA462.png 
华为云人工智能领域首席科学家田奇介绍如何从基础大模型炼成行业大模型

“盘古大模型基础层L0层,我们做了上百种能力,包括语言模型的实时问答,文案生成能力,视觉模型的检测分割,三维重建能力,多模态模型的文生图能力,以及模型编排和插件等高阶能力。盘古大模型的各项能力能够做到解耦和按需组合,企业客户可以根据具体的场景需求选择所需要的数据集,使用盘古大模型工作流,快速开发行业大模型性能力。” 华为云人工智能领域首席科学家田奇表示。

实现行业大模型的四大关键点,田奇分析指出:一是沉淀行业知识;二是淬炼行业技能,结合专家和行业数字环境的反馈进行强化学习,以达到符合行业应用的最佳结果;三是对话专业工具,除了人与机器的对话,我们更多解决的是机器与机器,机器与工具的对话,将大模型与业务系统进行融合,产生对话和交流,让大模型可以调用大量的行业资产和工具;四是保证安全合规,盘古提供公有云、混合云大模型专区,这三种模式保证安全部署。建立长效机制,确保大模型安全合规,包括数据集来源和使用合规,数据全生命周期安全,构建完整的数据标注以及审核机制,构建模型合规使用的政策,确保大模型的使用边界。

华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。

张平安还宣布,单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。同时,这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。

小结:

行业专家强调AI赋能千行百业,行业大模型非常重要。通用大模型有很强的能力,但并不能解决很多企业的具体问题。企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型构建自己的专属模型,也许是企业更优的选项。

盘古大模型3.0已经开始在10多个行业践行智能化的能力,目前国内在金融、政府、教育、电信、能源领域,多家公司已经发布了行业大模型,竞争日益激烈,具体客户是否能为华为云、百度云、科大讯飞等公司推出的行业大模型买单,关键还要看各家迭代的模型在实际应用当中的应用效果和价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    35800

    浏览量

    260740
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4970
  • 盘古大模型
    +关注

    关注

    1

    文章

    112

    浏览量

    967
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中科曙光助力紫东太初4.0大模型重磅发布

    近日,全球首个“深度推理+多模态”大模型——“紫东太初”4.0在2025东湖国际人工智能高峰论坛上正式发布。中科曙光作为核心生态伙伴,依托中国首个AI计算开放架构,为“紫东太初”4.0提供图文多模态
    的头像 发表于 09-24 09:33 441次阅读

    华为推出人工智能气象预报模型V2.0版本

    华为全联接大会2025期间,在气象海洋论坛上,华为联合重庆市气象局、云辑数科发布“天资·12h”人工智能气象预报模型(V2.0),助力成渝地
    的头像 发表于 09-20 14:34 1682次阅读

    IBM联合NASA发布开源AI模型重要突破

    近日,IBM(纽交所代码:IBM)与美国国家航空航天局 (NASA) 联合发布了一款开创性的开源基础模型,可理解高分辨率的太阳观测数据,从而预测太阳活动对地球和太空技术的影响。该模型名为“Surya
    的头像 发表于 09-02 09:16 652次阅读

    ​​FourCastNet 3实现快速精准的大型集合天气预报

    FourCastNet 3(FCN3)是 NVIDIA Earth-2 中最新的 AI 全球天气预报系统。FCN3 首次完美地结合了概率预测能力、计算效率、频谱保真度、集合校准和次季节
    的头像 发表于 08-30 15:49 1858次阅读

    华为宣布开源盘古7B稠密和72B混合专家模型

    电子发烧友网综合报道 2025年6月30日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿
    的头像 发表于 07-06 05:51 7100次阅读

    华为正式开源盘古7B稠密和72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿
    的头像 发表于 06-30 11:19 1119次阅读

    华为云联合中国农科院打造农业科学发现大模型

    近日,华为开发者大会2025(HDC 2025)于东莞举办。在主题演讲中,华为常务董事、华为云计算BU CEO张平安宣布盘古模型5.5正式
    的头像 发表于 06-26 11:51 841次阅读

    华为开发者大会2025(HDC 2025)亮点:华为发布盘古模型5.5 宣布新一代昇腾AI云服务上线

    HarmonyOS、昇腾AI云服务、盘古模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix384 超节点的新一代昇腾AI云服务
    的头像 发表于 06-20 20:19 3938次阅读
    <b class='flag-5'>华为</b>开发者大会2025(HDC 2025)亮点:<b class='flag-5'>华为</b>云<b class='flag-5'>发布</b><b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b>5.5 宣布新一代昇腾AI云服务上线

    华为助力中国石油发布3000亿参数昆仑大模型

    5月28日,中国石油发布3000亿参数昆仑大模型,标志着中国石油在人工智能领域又迈出关键一步,全力推动“人工智能+”行动走深走实。   中国石油发布3000亿
    的头像 发表于 05-29 09:19 897次阅读
    <b class='flag-5'>华为</b>助力中国石油<b class='flag-5'>发布</b>3000亿<b class='flag-5'>参数</b>昆仑大<b class='flag-5'>模型</b>

    手把手教你Coze智能体搭建,让智能设备天气预报小助手

    在科技飞速发展的当下,智能设备不断融入我们的生活,为我们带来便利。你是否想过,让自己的硬件设备如ESP32AgentDevKit开发套件也能天气预报小助手,实现“询问即显示”的酷炫智能交互效果
    的头像 发表于 04-07 18:06 4170次阅读
    手把手教你Coze智能体搭建,让智能设备<b class='flag-5'>秒</b>变<b class='flag-5'>天气预报</b>小助手

    软通计算机重磅发布DeepSeek大模型一体机产品

    3月20日,华为中国合作伙伴大会2025在深圳盛大启幕。大会上,软通计算机重磅发布了“DeepSeek大模型一体机产品”,为用户提供一站式的AI应用算力平台,让大
    的头像 发表于 03-22 10:40 1343次阅读
    软通计算机<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>DeepSeek大<b class='flag-5'>模型</b>一体机产品

    数据大屏开发用 AI 效率翻倍!华为云 Astro 大屏应用盘古助手,这波操作太震撼了!

    Hey,开发者们!发布一则最新消息,那就是华为云 Astro 大屏应用盘古助手的版本发布了!  想不想让自己的数据大屏项目变得更快、更智能、更有趣?现在,
    的头像 发表于 02-26 11:44 3020次阅读
    数据大屏开发用 AI 效率翻倍!<b class='flag-5'>华为</b>云 Astro 大屏应用<b class='flag-5'>盘古</b>助手,这波操作太震撼了!

    字节跳动发布豆包大模型1.5 Pro

    3.5 Sonnet等模型。 该模型采用大规模稀疏MoE架构,使用较小的激活参数进行预训练,却能等效7倍激活参数的Dense模型性能,远超
    的头像 发表于 01-23 10:24 1128次阅读

    【「大模型启示录」阅读体验】对大模型更深入的认知

    的平衡,解释得清清楚楚,让我这个非专业人士也能明白大模型在实际应用中面临的挑战和限制,也对这些模型的复杂性和挑战有了更深的理解。 而且,书中还提到了OpenAI的成功案例和CUDA技
    发表于 12-20 15:46

    阶跃星辰发布国内首个千亿参数端到端语音大模型

    近日,阶跃星辰在官方公众号上宣布了一项重大突破——推出Step-1o千亿参数端到端语音大模型。该模型被誉为“国内首个千亿
    的头像 发表于 12-17 13:43 1060次阅读