0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Say Hi to ERNIE!Imagination GPU率先完成文心大模型的端侧部署

颖脉Imgtec 2025-07-01 08:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Imagination Technologies 宣布率先完成百度文心大模型(ERNIE 4.5 开源版)在其 GPU 硬件上的端侧部署。适配完成后,开发者可在搭载 Imagination GPU 的设备上实现高效本地 AI 推理,同时大幅降低推理成本,这一成果也标志着 Imagination GPU 在端侧 AI 推理场景中的技术领先性。


Imagination高度优化软件栈实现高效本地AI推理、降低成本

本次适配的文心4.5模型为开源版本,具备强大的智能问答、文本生成、语义理解和知识推理能力,广泛适用于移动设备、语音助手、IoT和教育硬件等资源受限终端。在飞桨框架支持下,Imagination GPU平台展现出出色的推理性能。

Imagination基于现有的GPU硬件顺利完成了本次文心大模型系列开源模型部署软件栈,并得到实际网络验证。同时,Imagination高度优化的计算软件栈对AI本地推理性能进行优化,该软件栈包含OpenCL计算库,编译器工具链,主流编程框架的参考开发套件(Reference Kits)。

其中参考开发套件可协助开发者通过TVM将主流AI框架中的代码迁移至Imagination的软件栈。该套件基于Imagination优化的OpenCL计算库和图编译器,使用专属API调用,提供全面的文档说明和组件集成参考,便于客户将其高效融入自身开发流程。


Imagination与百度协同创新,加速大模型端侧普及

适配过程中,Imagination与百度团队紧密合作,针对文心4.5的特点进行了优化。推理方面,百度文心提出了多专家并行协同量化方法和卷积编码量化算法,实现了效果接近无损的4-bit量化和2-bit量化。此外,还实现了动态角色转换的预填充、解码分离部署技术,可以更充分地利用资源,提升文心4.5 MoE模型的推理性能。基于飞桨框架,文心4.5在Imagination GPU硬件平台上表现出优异的推理性能。

Imagination在今年5月推出了面向边缘AI的E 系列 GPU,具备高性能、低功耗和灵活可编程的特点,适用于自然语言处理、工业计算机视觉、自动驾驶等应用。此次与文心模型的成功适配,也为未来客户在采用E系列GPU构建本地AI应用奠定了坚实基础。

早在此前,Imagination加由入百度飞桨发起的 “硬件生态共创计划”将飞桨的先进算法和灵活性与 Imagination IP 技术相结合,为端侧开发者提供强大支持。随着边缘计算需求的快速增长,Imagination将继续与百度深入合作,推动大模型在端侧设备的普及与落地,共同打造更高效、智能的本地AI体验。

bc3ad94a-5610-11f0-986f-92fbcf53809c.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134471
  • AI
    AI
    +关注

    关注

    89

    文章

    38134

    浏览量

    296732
  • imagination
    +关注

    关注

    1

    文章

    617

    浏览量

    63098
  • 大模型
    +关注

    关注

    2

    文章

    3444

    浏览量

    4970
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度文模型5.0-Preview文本能力国内第一

    11月8日凌晨,LMArena大模型竞技场最新排名显示,文全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中国第一该
    的头像 发表于 11-11 17:15 1103次阅读

    基于Vulkan的侧AI运算

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用图形接口Vulkan的计算着色器能力,在侧部署模型的的整体思路和实践分享。
    的头像 发表于 09-10 17:19 955次阅读
    基于Vulkan的<b class='flag-5'>端</b>侧AI运算

    荣获两大奖项,Imagination新一代GPU引领侧AI新时代

    2025年8月26日,在深圳会展中心举办的Elexcon2025深圳国际电子展“嵌入式AI、边缘智能与AIoT生态会议“上,Imagination公司分享了在侧AI的技术创新与解决方案。同时
    的头像 发表于 08-28 11:26 1129次阅读
    荣获两大奖项,<b class='flag-5'>Imagination</b>新一代<b class='flag-5'>GPU</b>引领<b class='flag-5'>端</b>侧AI新时代

    【VisionFive 2单板计算机试用体验】3、开源大语言模型部署

    , Gemma等开源大模型。当然,一些闭源的(类似chatgpt, gemini)是不支持部署的。如下图: 在侧部署模型,个人认为最大
    发表于 07-19 15:45

    宁畅与与百度文模型展开深度技术合作

    近日,百度正式开源文模型4.5系列模型。作为文开源合作伙伴,宁畅在模型开源首日即实现即刻部署
    的头像 发表于 07-07 16:26 656次阅读

    兆芯率先展开文心系列模型深度技术合作

    6月30日,百度正式开源文模型4.5系列等10款模型,并实现预训练权重和推理代码的完全开源,兆芯率先与文心系列模型展开深度技术合作。 兆
    的头像 发表于 07-01 10:49 789次阅读

    Imagination与澎峰科技携手推动GPU+AI解决方案,共拓计算生态

    的深度融合展开合作。双方将结合 Imagination 领先的 GPU IP 技术与澎峰科技在 AI 模型压缩与性能优化方面的软硬协同能力,共同开拓面向 AI 行业应用的计算解决方案,推动国产计算生态
    发表于 05-21 09:40 1113次阅读

    MediaTek天玑9400率先完成阿里Qwen3模型部署

    通义大模型团队在天玑 9400 旗舰移动平台上率先完成 Qwen3(千问 3)的侧部署。未来,搭载天玑 9400 移动平台的设备可充分发挥
    的头像 发表于 05-08 10:11 942次阅读

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型。摩尔线程团队在模型发布当天,率先完成了Qwen3全系列模型在全功能
    的头像 发表于 05-07 15:24 838次阅读

    AI侧部署案例(SC171开发套件V3)

    AI侧部署案例(SC171开发套件V3) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 初学者入门手写数字识别案例 20分02秒 https://t.elecfans.com
    发表于 04-16 18:33

    AI侧部署开发(SC171开发套件V3)

    AI侧部署开发(SC171开发套件V3) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 Fibo AI Stack模型转化指南------Docker Desktop环境操作
    发表于 04-16 18:30

    AI大模型侧部署正当时:移远端侧AI大模型解决方案,激活场景智能新范式

    在AI技术飞速发展的当下,AI大模型的应用正从云端向侧加速渗透。 作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在AI大模型
    发表于 03-27 11:26 427次阅读
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b><b class='flag-5'>侧部署</b>正当时:移远端侧AI大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    AI大模型侧部署正当时:移远端侧AI大模型解决方案,激活场景智能新范式

    在AI技术飞速发展的当下,AI大模型的应用正从云端向侧加速渗透。作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在AI大模型
    的头像 发表于 03-26 19:05 992次阅读
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b><b class='flag-5'>侧部署</b>正当时:移远端侧AI大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    绍兴数据局率先实现政务环境下的DeepSeek模型部署

    2月14日,绍兴数据局率先基于华为昇腾服务器,成功部署上线DeepSeek全尺寸大模型,在全省率先实现政务环境下的DeepSeek模型
    的头像 发表于 02-20 11:22 1746次阅读
    绍兴数据局<b class='flag-5'>率先</b>实现政务环境下的DeepSeek<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    百度下一代文模型正式开源

    随着文模型的迭代升级和成本不断下降,文一言将于4月1日0时起全面免费,所有PC和APP用户均可体验文心系列最新
    的头像 发表于 02-17 13:44 808次阅读