0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为宣布开源盘古7B稠密和72B混合专家模型

Carol Li 来源:电子发烧友网 作者:李弯弯 2025-07-06 05:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 2025年6月30日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型及基于昇腾的模型推理技术,此举标志着华为在AI技术生态建设领域迈出关键一步,为全球开发者、企业及研究人员提供了强大的技术支撑。

华为此次开源行动涵盖三大核心板块:盘古Pro MoE 72B模型权重与基础推理代码已率先上线开源平台;基于昇腾的超大规模MoE模型推理代码同步开放;盘古7B稠密模型相关代码将于近期完成上线。开发者可通过华为开源社区(https://gitcode.com/ascend-tribe)获取完整技术资源,参与模型优化与生态共建。

作为70亿参数的紧凑型模型,盘古7B在保持高效推理能力的同时,显著降低部署门槛。其设计聚焦行业场景的快速适配,特别适合资源受限环境下的边缘计算应用,为中小企业提供高性价比的AI解决方案。

该模型采用创新性的分组混合专家架构(MoGE),通过动态激活机制实现160亿参数的高效利用。在SuperCLUE评测中,其以720亿总参数量达到59分,与千亿级模型持平,展现出“小参数量、大能力”的技术优势。基于昇腾AI计算平台的优化,单卡推理吞吐量达2300 Tokens/s,较传统架构提升4倍,支持384个专家并行推理的超级节点架构,更将算力利用率(MFU)提升50%以上。

华为通过开源构建开放创新生态,吸引全球开发者参与模型优化。目前,盘古大模型已形成覆盖数据管理、训练、部署的全生命周期工具链,支持企业定制化开发。这种“基础开源+商业增值”模式,既降低技术使用门槛,又通过商业发行版形成可持续的盈利路径。

在金融、制造、医疗等领域,盘古模型的动态负载均衡技术使云端推理成本降低30%,支撑高并发实时作业场景。基于MoGE架构的轻量化引擎,可适配昇腾系列芯片,使百亿级模型在边缘设备高效运行,为工业互联网、智能座舱等场景开辟新应用空间。

作为首个由亚洲企业主导的AI大模型开源项目,华为的实践正在改变国际技术竞争格局。通过Apache-2.0协议运营,盘古模型已吸引科大讯飞、中国科学院等1300家机构采用,推动中国AI技术从跟跑向并跑乃至领跑转变。

此次开源行动,是华为“把复杂留给自己,把简单留给客户”技术理念的生动实践。当72B模型的专家网络在昇腾超节点上高效运转,当7B模型的轻量化部署突破行业边界,中国AI产业正以开源为支点,撬动全球技术创新的新范式。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36190

    浏览量

    262694
  • 盘古大模型
    +关注

    关注

    1

    文章

    112

    浏览量

    1062
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    沐曦股份Day 0适配阿里千问Qwen3.6-35B-A3B模型

    阿里巴巴千问模型团队最新宣布开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型。沐曦股份与FlagOS合作,完成了该
    的头像 发表于 04-22 11:13 551次阅读
    沐曦股份Day 0适配阿里千问Qwen3.6-35<b class='flag-5'>B-A3B</b>大<b class='flag-5'>模型</b>

    壁仞科技光速支持阿里Qwen3.6-35B-A3B模型

    4月16日晚,阿里巴巴通义实验室正式宣布全量开源Qwen3.6-35B-A3B模型。该模型混合
    的头像 发表于 04-20 17:50 1505次阅读

    大晓机器人开源实时生成世界模型Kairos 3.0-4B

    近日,大晓机器人重磅开源开悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作为业内首个实现 “多模态理解 — 生成 — 预测” 一体化的
    的头像 发表于 03-14 16:54 2003次阅读
    大晓机器人<b class='flag-5'>开源</b>实时生成世界<b class='flag-5'>模型</b>Kairos 3.0-4<b class='flag-5'>B</b>

    模型推理服务的弹性部署与GPU调度方案

    7B 模型 FP16 推理需要约 14GB 显存,70B 模型需要 140GB+,KV Cache 随并发数线性增长,显存碎片化导致实际利用率不足 60%。
    的头像 发表于 03-03 09:29 408次阅读

    基于合众恒跃rk3576 开发板deepseek-r1-1.5b/7b 部署指南

      核心结论:部署流程分为 5 大核心步骤,依次为基础环境安装、模型下载、模型格式转换、部署程序编译、开发板运行测试,1.5b 模型适配 4+32G 开发板,
    的头像 发表于 12-09 07:08 727次阅读
    基于合众恒跃rk3576 开发板deepseek-r1-1.5<b class='flag-5'>b</b>/<b class='flag-5'>7b</b> 部署指南

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的本地部署。
    的头像 发表于 10-29 16:59 1417次阅读

    阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thi
    的头像 发表于 08-12 17:15 7023次阅读
    阿里通义千问发布小尺寸<b class='flag-5'>模型</b>Qwen3-4<b class='flag-5'>B</b>,手机也能跑

    Arm率先适配腾讯混元开源模型,助力端侧AI创新开发

    本周初,腾讯混元宣布开源四款小尺寸模型(参数分别为 0.5B、1.8B、4B
    的头像 发表于 08-08 09:16 1553次阅读
    Arm率先适配腾讯混元<b class='flag-5'>开源</b><b class='flag-5'>模型</b>,助力端侧AI创新开发

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA Cosmos Reason-1-7B。这款先进的多模态大模型能够理解视频、进行物理
    的头像 发表于 07-09 10:17 1014次阅读

    华为正式开源盘古7B稠密72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型
    的头像 发表于 06-30 11:19 1445次阅读

    华为开发者大会2025(HDC 2025)亮点:华为云发布盘古模型5.5 宣布新一代昇腾AI云服务上线

    HarmonyOS、昇腾AI云服务、盘古模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为云计算CEO张平安宣布基于CloudMa
    的头像 发表于 06-20 20:19 4669次阅读
    <b class='flag-5'>华为</b>开发者大会2025(HDC 2025)亮点:<b class='flag-5'>华为</b>云发布<b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b>5.5 <b class='flag-5'>宣布</b>新一代昇腾AI云服务上线

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI 监督微调”和“物理 AI 强化学习”两个阶段的训练。其中
    的头像 发表于 06-04 13:43 1174次阅读

    代码革命的先锋:aiXcoder-7B模型介绍

       国内开源代码大模型 4月9日aiXcoder宣布正式开源7B模型Base版,仅仅过去一
    的头像 发表于 05-20 14:41 955次阅读
    代码革命的先锋:aiXcoder-<b class='flag-5'>7B</b><b class='flag-5'>模型</b>介绍

    NVIDIA RTX 5880 Ada与Qwen3系列模型实测报告

    近日,阿里巴巴通义千问团队正式推出新一代开源大语言模型——Qwen3 系列,该系列包含 6 款 Dense 稠密模型和 2 款 MoE 混合
    的头像 发表于 05-09 15:05 4683次阅读
    NVIDIA RTX 5880 Ada与Qwen3系列<b class='flag-5'>模型</b>实测报告

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源混合推理大语言模型 (LLM) 通义千问 Qwen3,此次 Qwen3 开源模型系列包含两款
    的头像 发表于 05-08 11:45 3218次阅读
    NVIDIA使用Qwen3系列<b class='flag-5'>模型</b>的最佳实践