0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MLPerf首次GPT大模型推理放榜 墨芯连续三届登顶

墨芯人工智能 来源:墨芯人工智能 2023-09-14 14:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着ChatGPT等AIGC应用掀起大模型浪潮,算力层作为基础设施,成为最先受益的产业。

然而,算力需求大、费用昂贵等问题,已成为企业落地大模型的普通痛点,更可能制约AI向前发展:大模型参数日益增长,而算力供给瓶颈迫在眉睫,二者形成巨大矛盾。

如何探索更好的大模型算力方案,是业界共同关注的焦点。

近日,全球权威测评MLPerf 公布最新推理测评结果,这是MLPerf首度引入GPT大模型推理测试,参与热度再创纪录,收到了来自英伟达英特尔、谷歌、高通等企业提交的13500 多项性能结果。

4aa1d2b4-52bd-11ee-a25d-92fbcf53809c.png

在MLPerf Inference 3.1中,墨芯人工智能(Moffet AI)S30计算卡在大模型GPT-J(60亿参数)上,单卡、4卡、8卡的算力均获得第一。

这是墨芯在MLPerf上连续第三次卫冕。此前墨芯曾在MLPerf Inference 2.0与2.1上,连续两届获得第一。

墨芯的成绩,为大模型算力方案带来了可行的创新方向。

事实证明:结合AI模型与计算平台的软硬协同创新,能够释放更大的算力潜力。这也再度印证:以稀疏计算为代表的创新技术,将是大模型时代算力发展的关键。

墨芯参加的是MLPerf开放分区,据主办方MLCommons介绍,该分区旨在鼓励创新。因此参赛者可以通过软硬协同等方式,探索对算力的提升。在MLPerf中的GPT-J大模型上,与4nm制程的H100纯硬件加速方案相比,12nm制程的墨芯S30计算卡通过“原创的双稀疏算法+硬件协同”方式,取得了高达1.8倍的优势。

本次测评的GPT-J模型是生成式AI模型,墨芯S30计算卡在8卡、4卡、单卡模式下,性能分别为170.59,91.57,23.28 (Sample/s),达到英伟达H100性能的1.6倍、1.8倍、1.8倍,展现出墨芯产品在AIGC类任务上的能力。

4b02a418-52bd-11ee-a25d-92fbcf53809c.png

三度夺冠,大模型算力率先“交卷”,软硬协同持续创新——墨芯的产品实力数次经过MLPerf的严格检验,也探索出大模型算力发展的新路径。

1

稀疏计算——大模型“潜力股”

获得市场认可

墨芯接连的优异成绩,主要得益于基于稀疏化算法的软硬协同设计。

在大模型时代,稀疏计算的重要性不言而喻:AI模型大小与其稀疏化潜力成正比。

也就是说,当模型越大,算法上有更大稀疏的可能性,稀疏计算可加速的幅度也越高。对于一般大型语言模型,稀疏计算可带来数十倍加速。

墨芯独创的双稀疏算法,结合软硬协同设计,使墨芯Antoum芯片成为全球首款高稀疏倍率AI芯片,支持高达32倍稀疏——这也正是墨芯在本次MLPerf中创新纪录的关键。

模型越大,稀疏计算的优势越明显——尤其是在GPT等大模型参数动辄上百亿、千亿的现状下,这使得墨芯的护城河更为稳固。

墨芯的产品实力与稀疏计算的大势所趋,也获得了市场的认可:墨芯商业化进程接连取得重要突破,助力企业加速AI应用。

就在近日,墨芯成为支持Byte MLPerf的供应商之一

4b33ae5a-52bd-11ee-a25d-92fbcf53809c.png

来源:Byte MLPerf网站

当前,墨芯AI计算平台已能够支持不同参数级别的大模型,包括 BLOOM, OPT, GPT-J,LLaMA,StableDiffusion等。同时具有高吞吐、低延时、低功耗等特点,缓解算力之困,真正为企业带来“好用”、“用得起”的大模型算力方案。

2

带来根本性的算力变革

稀疏计算助力大模型发展

墨芯的稀疏计算方案不仅能够缓解当前的算力难题,也为AI的持续发展打开新的空间。

稀疏计算减少了AI模型的计算量,这意味着能让大模型既在参数量上跃升若干个数量级的同时,又不产生过大的计算量,大模型参数增长与算力瓶颈的矛盾有望从根本上得到解决。

同时,由于计算量的减少,大模型的高算力需求、高功耗、高费用等痛点,也一并得到解决,实现“多赢”效果。

墨芯Antoum芯片:全球首款高稀疏倍率AI芯片,支持高达32倍稀疏

连续三届MLPerf的优异成绩,不仅是对墨芯产品实力的证明,也为业界带来新启示:在稀疏计算等技术的助力下,大模型的发展与应用有望迎来更广阔的施展空间,加速AIGC等应用在各行各业遍地开花。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16718
  • AI芯片
    +关注

    关注

    17

    文章

    2066

    浏览量

    36570
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10077

原文标题:MLPerf首次GPT大模型推理放榜,墨芯连续三届登顶

文章出处:【微信号:墨芯人工智能,微信公众号:墨芯人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5.1发布 OpenAI开始拼情商

    -5.1 Thinking:高级推理模型,在简单任务上更快,在复杂任务上更持久,也更容易理解。 对于新上线的GPT-5.1大模型,OpenAI 官方表示出色的 AI 不仅是要够聪明,还要让人与之对
    的头像 发表于 11-13 15:49 555次阅读

    商汤日日新V6.5多模态大模型登顶全球权威榜单

    Pro)多模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型
    的头像 发表于 09-10 09:55 498次阅读

    NVIDIA从云到边缘加速OpenAI gpt-oss模型部署,实现150万TPS推理

    Token (TPS)。 这两个 gpt-oss 模型是具有链式思维和工具调用能力的文本推理大语言模型 (LLM),采用了广受欢迎的混合专家模型
    的头像 发表于 08-15 20:34 1967次阅读
    NVIDIA从云到边缘加速OpenAI <b class='flag-5'>gpt</b>-oss<b class='flag-5'>模型</b>部署,实现150万TPS<b class='flag-5'>推理</b>

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 AI 生产力!
    的头像 发表于 08-14 11:34 1158次阅读

    请问如何在RK3588上使用npu,用onnx模型推理

    请问如何在瑞微 RK3588上使用npu,用onnx模型推理。官网上介绍说要把ONNX模型转换成RKNN模型。但是我并不想这么干,请问有
    发表于 08-09 00:51

    商汤绝影携手NVIDIA亮相第三届链博会

    近日,第三届中国国际供应链促进博览会(以下简称链博会)在北京隆重开幕,全球人工智能领军企业NVIDIA(英伟达)首次参展链博会,绝影亮相NVIDIA展台。
    的头像 发表于 07-30 10:40 1013次阅读

    三届开放原子大赛正式启动

    近日,在2025开放原子开源生态大会开幕式上,第三届开放原子大赛正式启动,首批12个赛项同步发布。
    的头像 发表于 07-28 17:03 926次阅读

    奇异摩尔出席第三届粒开发者大会AI芯片与系统分论坛

    近日,第三届粒开发者大会圆满落幕。大会在“集成芯片前沿技术科学基础”重大研究计划指导下,由中国科学院计算技术研究所、中国电子科技集团公司第五十八研究所联合主办,共有50余名嘉宾做报告,吸引了300
    的头像 发表于 07-22 11:34 1001次阅读

    科技亮相第三届粒开发者大会

    在刚刚于无锡圆满落幕的第三届粒开发者大会——这场汇聚全球顶尖芯片企业、科研机构及产业链专家的盛会上,行科技作为国内Signoff领域的领军企业,受邀发表了主题演讲《面向3DIC的Signoff挑战与行
    的头像 发表于 07-18 10:22 739次阅读

    模型推理显存和计算量估计方法研究

    估算剪枝后的模型所需的显存大小。 、计算量估计方法 基于模型结构的计算量估计 根据深度学习模型的层次结构和参数数量,可以估算模型
    发表于 07-03 19:43

    公司入选第三届能源电力行业高价值专利及技术成果转化典型案例

    近日,中国能源研究会公布第三届能源电力行业高价值专利及技术成果转化典型案例评选结果,智公司牵头申报的2项专利技术成果成功入选,其中核心型高价值专利(技术)成果1项、核心型高价值专利(技术)成果转化典型案例1项,这也是智公司
    的头像 发表于 06-11 17:09 925次阅读

    工信部第三届能源电子产业创新大赛|御微承办WIoTa能源物联网应用专题赛

    》、《新型储能制造业高质量发展行动方案》有关部署,工业和信息化部产业发展促进中心自2022年以来连续举办了三届先进储能技术创新挑战赛、两能源电子产业创新大赛,累计收到
    的头像 发表于 06-10 11:28 1227次阅读
    工信部第<b class='flag-5'>三届</b>能源电子产业创新大赛|御<b class='flag-5'>芯</b>微承办WIoTa能源物联网应用专题赛

    中兴通讯星云大模型登顶SuperCLUE推理专项榜单

    近日,中文大模型权威测评基准SuperCLUE发布《中文大模型基准测评2025年5月报告》。报告显示,中兴通讯自主研发的星云大模型NebulaCoder-V6在推理专项榜单中斩获榜单金
    的头像 发表于 06-04 16:44 1208次阅读

    三届百度文心杯创业大赛启动

    近日,第三届“文心杯”创业大赛面向全球正式启动报名。
    的头像 发表于 04-30 10:24 767次阅读

    今日看点丨OpenAI将发布新的GPT-4.5模型星西安工厂将升级286层NAND闪存工艺

    1. OpenAI 将发布新的GPT-4.5 模型   OpenAI首席执行官阿尔特曼周表示,该公司内部称为Orion的GPT-4.5模型
    发表于 02-13 11:22 666次阅读