0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

盘古大模型与ChatGPT的模型基础架构

微云疏影 来源:综合整理 作者:综合整理 2023-09-05 09:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

华为盘古大模型

华为盘古大模型以Transformer模型架构为基础,利用深层学习技术进行训练。模型的每个数量达到2.6亿个,是目前世界上最大的汉语预备训练模型之一。这些模型包含许多小模型,其中最大的模型包含1亿4千万个参数。

ChatGPT

此外,chatgpt基于transformer模型架构,并训练深入学习技术。该模型的每个数量达1亿5千万个,是目前最常用的英语事前训练模型之一。

在基础设施方面,华为盘古大模型和chatgpt都采用变形金刚模型结构,但华为盘古大模型的参数数量远远多于chatgpt。这意味着华为盘古大模型在处理更复杂的任务时,具有更强的表达能力和推理能力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35783

    浏览量

    260710
  • 架构
    +关注

    关注

    1

    文章

    533

    浏览量

    26506
  • 盘古大模型
    +关注

    关注

    1

    文章

    112

    浏览量

    966
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    有源铜缆:大模型背后的隐形英雄

    现在大家都在关注大模型,像ChatGPT,xAI等,尤其是Deepseek,最近都火出圈了!
    的头像 发表于 07-11 14:16 1013次阅读
    有源铜缆:大<b class='flag-5'>模型</b>背后的隐形英雄

    鸿蒙中Stage模型与FA模型详解

    模型中, featureAbility 是旧版FA模型(Feature Ability)的用法 ,Stage模型已采用全新的应用架构,推荐使用 组件化的上下文获取方式 ,而非依赖
    的头像 发表于 07-07 11:50 623次阅读

    华为宣布开源盘古7B稠密和72B混合专家模型

    电子发烧友网综合报道 2025年6月30日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿参数的混合专家模型及基于昇腾的模型
    的头像 发表于 07-06 05:51 7096次阅读

    华为正式开源盘古7B稠密和72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型
    的头像 发表于 06-30 11:19 1111次阅读

    华为云联合中国农科院打造农业科学发现大模型

    近日,华为开发者大会2025(HDC 2025)于东莞举办。在主题演讲中,华为常务董事、华为云计算BU CEO张平安宣布盘古模型5.5正式发布,五大基础模型全面升级,并分享了盘古
    的头像 发表于 06-26 11:51 836次阅读

    华为开发者大会2025(HDC 2025)亮点:华为云发布盘古模型5.5 宣布新一代昇腾AI云服务上线

    HarmonyOS、昇腾AI云服务、盘古模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix384 超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力;宣布
    的头像 发表于 06-20 20:19 3907次阅读
    华为开发者大会2025(HDC 2025)亮点:华为云发布<b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b>5.5 宣布新一代昇腾AI云服务上线

    FA模型卡片和Stage模型卡片切换

    卡片切换 卡片切换主要包含如下三部分: 卡片页面布局:FA模型卡片和Stage模型卡片的布局都采用类web范式开发可以直接复用。 卡片配置文件:FA模型的卡片配置在config.json中
    发表于 06-06 08:10

    知识分享 | 评估模型架构——如何实现?

    确保良好的模型架构对于开发安全和可靠的软件非常重要。本文为您介绍MES Model Examiner® (MXAM)如何优化模型架构,简化复杂度管理步骤,并最终提升软件质量。
    的头像 发表于 06-05 11:46 458次阅读
    知识分享 | 评估<b class='flag-5'>模型</b><b class='flag-5'>架构</b>——如何实现?

    如何赋能医疗AI大模型应用?

    引言自ChatGPT掀起热潮以来,众多AI大模型如雨后春笋般涌现,其中包括百度科技的文心一言、科大讯飞的讯飞星火、华为的盘古AI大模型、腾讯的混元AI大
    的头像 发表于 05-07 09:36 521次阅读
    如何赋能医疗AI大<b class='flag-5'>模型</b>应用?

    KaihongOS操作系统FA模型与Stage模型介绍

    KaihongOS中提供了不同的开发方式和架构选择,Stage模型因其在分布式应用开发中的优势而被推荐使用。 说明:KaihongOS文档中心中应用开发(开发准备、快速入门、进阶提高模块中的示例代码均基于Stage模型。)
    发表于 04-24 07:27

    字节豆包大模型团队提出稀疏模型架构

    字节跳动豆包大模型Foundation团队近期研发出UltraMem,一种创新的稀疏模型架构,旨在解决推理过程中的访存问题,同时确保模型效果不受影响。
    的头像 发表于 02-13 15:25 1016次阅读

    字节豆包大模型团队推出UltraMem稀疏架构

    字节跳动豆包大模型Foundation团队近期在稀疏模型架构领域取得了新突破,提出了一种名为UltraMem的新型架构。这一架构通过将计算和
    的头像 发表于 02-13 11:17 1060次阅读

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    研读《具身智能机器人系统》第7-9章,我被书中对大模型与机器人技术融合的深入分析所吸引。第7章详细阐述了ChatGPT for Robotics的核心技术创新:它摒弃了传统的分层控制架构,创造性地
    发表于 12-24 15:03

    【「大模型启示录」阅读体验】+开启智能时代的新钥匙

    阅读之旅。在翻开这本书之前,我对大模型的认知仅仅停留在它是一种强大的人工智能技术,可以进行自然语言处理、图像识别等任务。我知道像 ChatGPT 这样的应用是基于大模型开发的,能够与人类进行较为流畅
    发表于 12-24 13:10

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    地选择适合的模型。不同的模型具有不同的特点和优势。在客服领域,常用的模型包括循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)、Transformer等,以及基于这些
    发表于 12-17 16:53