0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Say Hi to ERNIE!Imagination GPU率先完成文心大模型的端侧部署

颖脉Imgtec 2025-07-01 08:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Imagination Technologies 宣布率先完成百度文心大模型(ERNIE 4.5 开源版)在其 GPU 硬件上的端侧部署。适配完成后,开发者可在搭载 Imagination GPU 的设备上实现高效本地 AI 推理,同时大幅降低推理成本,这一成果也标志着 Imagination GPU 在端侧 AI 推理场景中的技术领先性。


Imagination高度优化软件栈实现高效本地AI推理、降低成本

本次适配的文心4.5模型为开源版本,具备强大的智能问答、文本生成、语义理解和知识推理能力,广泛适用于移动设备、语音助手、IoT和教育硬件等资源受限终端。在飞桨框架支持下,Imagination GPU平台展现出出色的推理性能。

Imagination基于现有的GPU硬件顺利完成了本次文心大模型系列开源模型部署软件栈,并得到实际网络验证。同时,Imagination高度优化的计算软件栈对AI本地推理性能进行优化,该软件栈包含OpenCL计算库,编译器工具链,主流编程框架的参考开发套件(Reference Kits)。

其中参考开发套件可协助开发者通过TVM将主流AI框架中的代码迁移至Imagination的软件栈。该套件基于Imagination优化的OpenCL计算库和图编译器,使用专属API调用,提供全面的文档说明和组件集成参考,便于客户将其高效融入自身开发流程。


Imagination与百度协同创新,加速大模型端侧普及

适配过程中,Imagination与百度团队紧密合作,针对文心4.5的特点进行了优化。推理方面,百度文心提出了多专家并行协同量化方法和卷积编码量化算法,实现了效果接近无损的4-bit量化和2-bit量化。此外,还实现了动态角色转换的预填充、解码分离部署技术,可以更充分地利用资源,提升文心4.5 MoE模型的推理性能。基于飞桨框架,文心4.5在Imagination GPU硬件平台上表现出优异的推理性能。

Imagination在今年5月推出了面向边缘AI的E 系列 GPU,具备高性能、低功耗和灵活可编程的特点,适用于自然语言处理、工业计算机视觉、自动驾驶等应用。此次与文心模型的成功适配,也为未来客户在采用E系列GPU构建本地AI应用奠定了坚实基础。

早在此前,Imagination加由入百度飞桨发起的 “硬件生态共创计划”将飞桨的先进算法和灵活性与 Imagination IP 技术相结合,为端侧开发者提供强大支持。随着边缘计算需求的快速增长,Imagination将继续与百度深入合作,推动大模型在端侧设备的普及与落地,共同打造更高效、智能的本地AI体验。

bc3ad94a-5610-11f0-986f-92fbcf53809c.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5346

    浏览量

    136321
  • AI
    AI
    +关注

    关注

    91

    文章

    42405

    浏览量

    303362
  • imagination
    +关注

    关注

    1

    文章

    627

    浏览量

    63583
  • 大模型
    +关注

    关注

    2

    文章

    3895

    浏览量

    5322
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    广和通发布新一代桌面级双臂Fibot,率先支持π0.6模型侧部署

    模型π0.6在侧高效部署,并可基于物理世界数据集进行模型训练与迭代,助力机器人在真实场景中执行长时序且复杂的柔性任务,标志着广和通在具身智能
    的头像 发表于 04-28 18:50 2218次阅读
    广和通发布新一代桌面级双臂Fibot,<b class='flag-5'>率先</b>支持π0.6<b class='flag-5'>模型</b><b class='flag-5'>端</b><b class='flag-5'>侧部署</b>

    摩尔线程 x 中国移动|国产GPU率先支撑央企大模型,S5000完成九天35B大模型适配

    ,依托成熟的MUSA软件栈与高性能算子优化,已率先完成九天35B模型的全流程适配与推理验证。这不仅是国产GPU与央企大模型的深度协同,更意味
    发表于 04-28 08:32 1012次阅读

    壁仞科技壁砺166系列GPU产品率先支持Kimi K2.6模型

    砺166系列在Kimi K2.6模型开源后率先完成模型接入与推理适配,为开发者及行业客户提供国产算力平台下的SOTA模型“首发体验”。
    的头像 发表于 04-23 16:30 2591次阅读
    壁仞科技壁砺166系列<b class='flag-5'>GPU</b>产品<b class='flag-5'>率先</b>支持Kimi K2.6<b class='flag-5'>模型</b>

    沐曦股份曦云C系列GPU产品Day 0适配百度文ERNIE-Image文生图模型

    4月15日,百度文模型团队重磅推出ERNIE‑Image文生图模型,沐曦股份曦云 C 系列 GPU
    的头像 发表于 04-15 17:39 633次阅读

    海光DCU Day0适配百度文ERNIE-Image文生图模型

      今天,百度文模型团队发布ERNIE-Image文生图模型,海光DCU同步完成Day0适配与深度调优。全球开发者、科研机构和企业现可免
    的头像 发表于 04-15 15:47 440次阅读

    Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配

    4月12日,摩尔线程旗舰级AI训推一体全功能GPU MTT S5000已完成对新一代大模型MiniMax M2.7的Day-0极速适配,再次验证了国产全功能GPU对前沿AI大
    发表于 04-13 07:57 1466次阅读
    Day-0支持|摩尔线程<b class='flag-5'>率先</b><b class='flag-5'>完成</b>MiniMax M2.7大<b class='flag-5'>模型</b>适配

    天数智芯完成阿里云通义千问Qwen3.5系列多模态模型全量适配

    近日,天数智芯携手众智FlagOS 社区完成阿里云通义千问 Qwen3.5 系列多模态模型全量适配,实现模型精度精准对齐与无缝
    的头像 发表于 03-26 09:25 2456次阅读

    AI侧部署案例(SC171开发套件V2-FAS)

    AI侧部署案例(SC171开发套件V2-FAS) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 初学者入门手写数字识别案例 32分21秒 https
    发表于 02-11 12:08

    AI侧部署开发(SC171开发套件V2-FAS)

    AI侧部署开发(SC171开发套件V2-FAS) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 Fibo AI Stack模型转化指南 27分19秒 https
    发表于 02-11 11:44

    AI侧部署案例(SC171开发套件V3)2026版

    AI侧部署案例(SC171开发套件V3)2026版 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 初学者入门手写数字识别案例 25分29秒 https
    发表于 01-15 10:40

    AI侧部署开发(SC171开发套件V3)2026版

    AI侧部署开发(SC171开发套件V3)2026版 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 Fibo AI Stack模型转化指南 27分19秒 https
    发表于 01-15 10:31

    百度文模型5.0 Preview荣登LMArena文本榜国内第一

    12月23日,LMArena大模型竞技场发布最新排名,文模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名国内第一该
    的头像 发表于 12-23 15:02 757次阅读

    百度文模型5.0-Preview文本能力国内第一

    11月8日凌晨,LMArena大模型竞技场最新排名显示,文全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中国第一该
    的头像 发表于 11-11 17:15 1755次阅读

    基于Vulkan的侧AI运算

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用图形接口Vulkan的计算着色器能力,在侧部署模型的的整体思路和实践分享。
    的头像 发表于 09-10 17:19 1863次阅读
    基于Vulkan的<b class='flag-5'>端</b>侧AI运算

    【VisionFive 2单板计算机试用体验】3、开源大语言模型部署

    , Gemma等开源大模型。当然,一些闭源的(类似chatgpt, gemini)是不支持部署的。如下图: 在侧部署模型,个人认为最大
    发表于 07-19 15:45