0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为云盘古大模型3.0正式发布,大模型系列架构汇总

微云疏影 来源:综合整理 作者:综合整理 2023-07-07 16:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

7月7日下午,华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安宣布,华为云盘古大模型3.0正式发布。

在会上,张平安发表主题演讲《一切皆服务,AI重塑千行百业》,对于华为盘古大模型,张平安表示,华为的盘古大模型“不作诗,只做事”,“盘古大模型很忙,忙着做事,没有时间作诗”

张平安称,盘古大模型3.0分为L0基础大模型、L1行业大模型、L2场景模型三层架构,将重塑千行百业。重点面向政务、金融、制造、医药、矿山、铁路、气象等行业。

盘古大模型3.0 是一个完全面向行业的大模型系列包括 5+N+X 三层架构,汇总如下:

第一层 L0 层是盘古的 5 个基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,它们提供满足行业场景的多种技能。

盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。

第二层 L1 层是 N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的 L0 和 L1 上,为客户训练自己的专有大模型。

第三层 L2 层是为客户提供更多细化场景的模型,它更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。

据悉,在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全诉求,盘古大模型还提供了公用云、大模型云专区、混合云等多样化的部署形态。

盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。

在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35782

    浏览量

    260696
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4963
  • 盘古大模型
    +关注

    关注

    1

    文章

    112

    浏览量

    966
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为架构大调整,波及千名员工,All in AI能否扭亏为盈

    )产品线下的盘古模型相关部门被明确撤销。   与此同时,有消息显示,调整后的华为将聚焦3+2+1业务,其中3为通算、智算、存储,2为AI PaaS、数据库,1为安全业务。   战略
    的头像 发表于 08-26 09:22 6894次阅读

    小白学大模型:国外主流大模型汇总

    )领域。论文的核心是提出了一种名为Transformer的全新模型架构,它完全舍弃了以往序列模型(如循环神经网络RNNs和卷积神经网络CNNs)中常用的循环和卷积结构
    的头像 发表于 08-27 14:06 660次阅读
    小白学大<b class='flag-5'>模型</b>:国外主流大<b class='flag-5'>模型</b><b class='flag-5'>汇总</b>

    华为CANN与智谱GLM端侧模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型已完成与CANN的适配。这标志着国产大模型与计算架构在端协同方向实现
    的头像 发表于 08-11 11:00 2192次阅读

    华为宣布开源盘古7B稠密和72B混合专家模型

    电子发烧友网综合报道 2025年6月30日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿参数的混合专家模型及基于昇
    的头像 发表于 07-06 05:51 7086次阅读

    超低延时重构AI推理体验!白山发布“大模型API”产品

    白山科技正式发布“大模型API”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大语言模型。基于白山全
    的头像 发表于 07-02 17:26 939次阅读
    超低延时重构AI推理体验!白山<b class='flag-5'>云</b><b class='flag-5'>发布</b>“大<b class='flag-5'>模型</b>API”产品

    华为正式开源盘古7B稠密和72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿参数的混合专家模型和基于昇
    的头像 发表于 06-30 11:19 1104次阅读

    华为联合中国农科院打造农业科学发现大模型

    近日,华为开发者大会2025(HDC 2025)于东莞举办。在主题演讲中,华为常务董事、华为计算BU CEO张平安宣布盘古
    的头像 发表于 06-26 11:51 832次阅读

    华为开发者大会2025(HDC 2025)亮点:华为发布盘古模型5.5 宣布新一代昇腾AI服务上线

    HarmonyOS、昇腾AI服务、盘古模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为
    的头像 发表于 06-20 20:19 3901次阅读
    <b class='flag-5'>华为</b>开发者大会2025(HDC 2025)亮点:<b class='flag-5'>华为</b><b class='flag-5'>云</b><b class='flag-5'>发布</b><b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b>5.5 宣布新一代昇腾AI<b class='flag-5'>云</b>服务上线

    知识分享 | 评估模型架构——如何实现?

    确保良好的模型架构对于开发安全和可靠的软件非常重要。本文为您介绍MES Model Examiner® (MXAM)如何优化模型架构,简化复杂度管理步骤,并最终提升软件质量。
    的头像 发表于 06-05 11:46 455次阅读
    知识分享 | 评估<b class='flag-5'>模型</b><b class='flag-5'>架构</b>——如何实现?

    数据大屏开发用 AI 效率翻倍!华为 Astro 大屏应用盘古助手,这波操作太震撼了!

    Hey,开发者们!发布一则最新消息,那就是华为 Astro 大屏应用盘古助手的版本发布了!  想不想让自己的数据大屏项目变得更快、更智能、
    的头像 发表于 02-26 11:44 2995次阅读
    数据大屏开发用 AI 效率翻倍!<b class='flag-5'>华为</b><b class='flag-5'>云</b> Astro 大屏应用<b class='flag-5'>盘古</b>助手,这波操作太震撼了!

    字节豆包大模型团队提出稀疏模型架构

    字节跳动豆包大模型Foundation团队近期研发出UltraMem,一种创新的稀疏模型架构,旨在解决推理过程中的访存问题,同时确保模型效果不受影响。
    的头像 发表于 02-13 15:25 1014次阅读

    湘钢与华为Stack打造钢铁大模型,32个场景应用落地

    近日,湘潭钢铁集团有限公司与华为等合作伙伴携手,在钢铁冶炼行业大模型应用方面取得了里程碑式的突破。基于华为Stack大模型混合
    的头像 发表于 02-13 10:20 863次阅读

    腾讯TI平台推出DeepSeek系列模型

    近日,腾讯TI平台宣布重要更新,正式上架DeepSeek系列模型。此次上架的模型包括参数量高达671B的“满血”V3和R1原版模型,以及基
    的头像 发表于 02-06 14:30 866次阅读

    京东正式上线DeepSeek系列模型

    实际需求,在京东官网上轻松实现一键部署。通过进入言犀AI开发计算平台的“AI资产市场”,开发者和企业可以便捷地选用DeepSeek系列模型,进行快速调用和应用。 为了满足不同场景下的数据安全需求,京东
    的头像 发表于 02-06 14:25 792次阅读

    字节跳动发布豆包大模型1.5 Pro

    3.5 Sonnet等模型。 该模型采用大规模稀疏MoE架构,使用较小的激活参数进行预训练,却能等效7倍激活参数的Dense模型性能,远超业内MoE
    的头像 发表于 01-23 10:24 1115次阅读