0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

后摩智能与高校合作研究成果荣获ISCA 2025最佳论文奖

后摩智能 来源:后摩智能 2025-07-05 11:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,北京后摩智能科技有限公司与北京大学集成电路学院孙广宇长聘副教授团队、上海交通大学张宸助理教授团队、香港科技大学谢源讲席教授团队、东南大学司鑫副教授团队及阿里巴巴达摩院合作的研究成果《H2-LLM: Hardware-Dataflow Co-Exploration for Heterogeneous Hybrid-Bonding-based Low-Batch LLM Inference》,成功荣获第52届计算机体系结构国际研讨会(ISCA)最佳论文奖。作为国内学术机构在该会议上的首次获奖成果,其核心创新聚焦于边缘侧大语言模型(LLM)推理加速架构的关键技术突破,为解决边缘设备高效LLM推理难题提供了创新性方案。

随着LLM在智能对话、代码生成、边缘推理等场景的规模化应用,如何在边缘设备上实现低延迟、高能效的推理计算,成为行业亟待攻克的技术瓶颈。现有DRAM近存计算架构虽具备高带宽优势,但受限于芯片计算逻辑嵌入设计,算力供给不足,难以满足边缘侧对计算密集型任务的加速需求。针对这一挑战,合作团队基于混合键合(Hybrid Bonding)新兴工艺,研发出面向边缘侧的H2-LLM推理加速架构。该架构通过提出通用近存计算架构模板,抽象设计空间以协调工艺中算力与带宽的权衡,并采用“以数据为中心”的数据流抽象优化异构硬件资源利用,实现了计算密集型与访存密集型算子的协同加速。实验数据显示,相较于基线DRAM近存架构,H2-LLM在LLM推理的预填充(Prefill)和解码(Decoding)阶段实现2.72倍的性能提升与1.48倍的能效优化,为边缘设备部署大语言模型提供了关键技术支撑。

此次成果是产学研协同创新的典范。北京大学孙广宇团队在领域定制芯片架构设计与自动化领域处于国际领先地位,研究成果多次获得顶级会议和期刊的最佳论文奖,并在多款芯片设计中实现产业验证。后摩智能与上海交通大学、东南大学、阿里巴巴达摩院的合作,充分发挥了各方在学术研究、技术开发和应用场景方面的优势,推动了边缘计算与大模型推理技术的工程化落地。

ISCA作为计算机体系结构领域的顶级国际会议,自1973年创办以来,始终是学术界与产业界技术交流的核心平台,与MICRO、HPCA、ASPLOS并称“体系结构四大会”。谷歌TPU、寒武纪芯片、华为昇腾等具有全球影响力的架构创新均曾在此首发。此次获奖标志着中国在边缘计算与LLM推理架构领域的研究已跻身国际顶尖行列,对推动我国人工智能底层技术发展具有重要意义。

未来,后摩智能将继续秉承开放合作、创新驱动的理念,与更多顶尖高校、科研机构和企业开展深度合作,共同推动智能计算技术的创新与发展。同时,后摩智能也将继续加强与各方的合作,围绕国家新一代人工智能战略需求,持续聚焦边缘侧计算与大模型推理的技术融合,共同推动智能计算技术的产业化应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 边缘计算
    +关注

    关注

    22

    文章

    3473

    浏览量

    52699
  • 大模型
    +关注

    关注

    2

    文章

    3446

    浏览量

    4971
  • LLM
    LLM
    +关注

    关注

    1

    文章

    340

    浏览量

    1257

原文标题:面向边缘侧LLM推理,后摩智能与北京大学等高校合作成果获 ISCA 2025 最佳论文

文章出处:【微信号:后摩智能,微信公众号:后摩智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智能六篇论文入选四大国际顶会

    2025年以来,智能在多项前沿研究领域取得突破性进展,近期在NeurIPS、ICCV、AAAI、ACMMM四大国际顶会上有 6 篇
    的头像 发表于 11-24 16:42 701次阅读
    <b class='flag-5'>后</b><b class='flag-5'>摩</b><b class='flag-5'>智能</b>六篇<b class='flag-5'>论文</b>入选四大国际顶会

    上海贝岭荣获2025金辑最佳技术实践应用

    2025年10月30日,由盖世汽车主办的第七届金辑颁奖盛典在上海圆满落幕。上海贝岭凭借车规级特高压MOSFET BLQ3N100E/BLQ3N120,荣获 “金辑
    的头像 发表于 11-07 16:53 569次阅读

    轩辕智驾荣获2025金辑最佳技术实践应用

    10月30日,由盖世汽车主办的2025 第七届金辑颁奖盛典在上海圆满落幕。轩辕智驾车载红外热成像安全系统荣获金辑2025
    的头像 发表于 11-02 17:48 2027次阅读

    爱芯元智荣获2025金辑最佳技术实践应用

    2025年盖世汽车第七届“金辑”揭晓,爱芯元智凭借全球化辅助驾驶芯片M57系列荣获最佳技术实践应用”。
    的头像 发表于 11-02 09:17 498次阅读

    奥比中光3D视觉技术赋能IROS 2025研究成果

    全球机器人领域最具影响力的学术会议IROS 2025于10月19日至25日在杭州国际博览中心举行。大会收录的多篇论文研究成果采用了奥比中光的3D视觉技术,涵盖自动化扫描、空间建模、人机交互等前沿方向,彰显了奥比中光在全球机器人
    的头像 发表于 10-23 16:29 562次阅读

    华为携手AIS斩获FutureNet Asia 2025最佳网络AI解决方案

    FutureNet Asia 2025峰会期间,华为携手泰国领先电信运营商AIS凭借在网络智能化领域的创新实践,荣获最佳网络AI解决方案
    的头像 发表于 10-14 15:02 609次阅读

    研华边缘AI系统MIC-ATL3S荣获CEC 2025年度最佳产品

    研华国产自主边缘AI系统MIC-ATL3S,在CEC2025年度最佳产品评选中荣获“CEC 2025年度最佳产品
    的头像 发表于 09-30 10:39 759次阅读

    斑马技术荣获2025亚洲最佳雇主品牌

    Zebra Technologies 斑马技术 荣获 2025 亚洲最佳雇主品牌(Asia Best Employer Brand Awards
    的头像 发表于 09-09 17:47 854次阅读

    中兴通讯荣获2025中国算力大会年度重大突破成果奖

    近日,在2025中国算力大会上,中兴通讯凭借“基于GPU卡间高速互联开放架构和自研‘凌云’AI交换芯片的智算超节点系统”荣获年度重大突破成果奖,这是继2025世界人工
    的头像 发表于 08-28 14:40 5333次阅读

    智芯公司荣获ICEPT 2025优秀论文

    Conductivity Design Optimization and Interconnect Process Exploration”(引线键合平面栅格阵列系统级封装高可靠与高导热设计优化及互连工艺探索)凭借高导热高可靠性封装技术的创新性研究成果荣获优秀
    的头像 发表于 08-26 11:22 957次阅读

    智能与麒麟软件达成战略合作

    8月6日,北京智能科技有限公司(以下简称“智能”)与麒麟软件战略
    的头像 发表于 08-07 18:16 1217次阅读

    Nullmax端到端自动驾驶最新研究成果入选ICCV 2025

    近日,国际计算机视觉大会 ICCV 2025 正式公布论文录用结果,Nullmax 感知团队在端到端自动驾驶方向的最新研究成果《HiP-AD: Hierarchical
    的头像 发表于 07-05 15:40 1568次阅读
    Nullmax端到端自动驾驶最新<b class='flag-5'>研究成果</b>入选ICCV <b class='flag-5'>2025</b>

    智能四篇论文入选三大国际顶会

    2025 年上半年,继年初被 AAAI、ICLR、DAC 三大国际顶会收录 5 篇论文智能
    的头像 发表于 05-29 15:37 1092次阅读

    深演智能与长安汽车荣获第六届非凡最佳行业汽车智能运营

    近日,在2025第六届“非凡”颁奖典礼上,深演智能与长安汽车凭借联合打造的“AI智能外呼系统”,从400+全球AI商业创新标杆产品和案例中脱颖而出,斩获“
    的头像 发表于 04-27 16:11 677次阅读

    智能5篇论文入选国际顶会

    2025年伊始,智能在三大国际顶会(AAAI、ICLR、DAC)中斩获佳绩,共有5篇论文被收录,覆盖大语言模型(LLM)推理优化、模型量
    的头像 发表于 02-19 14:02 1195次阅读
    <b class='flag-5'>后</b><b class='flag-5'>摩</b><b class='flag-5'>智能</b>5篇<b class='flag-5'>论文</b>入选国际顶会