0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新MLCommons结果公布 英特尔展现强大AI推理性能

英特尔中国 来源:未知 2023-09-15 19:35 次阅读

近日,MLCommons公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的MLPerf推理v3.1性能基准测试结果,其中包括英特尔所提交的基于HabanaGaudi2加速器、第四代英特尔至强可扩展处理器,以及英特尔至强CPU Max系列的测试结果。该结果显示了英特尔在AI推理方面极具竞争力的表现,并进一步加强了其对加速从云到网络到边缘再到端的工作负载中大规模部署AI的承诺。

正如最新的MLCommons结果显示,我们拥有强大的、具有竞争力的人工智能产品组合以满足客户对高性能、高效率的深度学习推理及训练的需求,同时,针对各种规模的人工智能模型,英特尔产品组合均具有领先的性价比优势。

--Sandra Rivera

英特尔执行副总裁

兼数据中心与人工智能事业部总经理

根据6月披露的MLCommonsAI训练结果1和Hugging Face性能基准测试2验证,Gaudi2在先进的视觉语言模型上拥有卓越的性能,而今天的结果进一步证明了英特尔能够提供满足AI计算需求的绝佳解决方案。

考虑到客户的个性化需求,英特尔正在通过能够帮助解决AI工作负载中推理与训练问题的产品,让AI无处不在。英特尔的AI产品为客户提供了可根据各自性能、效率及目标成本进行灵活匹配以获取最佳AI解决方案的理想选择,同时亦帮助客户开放生态系统。

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

关于Habana Gaudi2的测试结果:

Habana Gaudi2在GPT-J模型上的推理结果强有力地验证了其具有竞争力的性能。

Gaudi2在GPT-J-99和GPT-J-99.9上的服务器查询和离线样本的推理性能分别为78.58次/秒和84.08次/秒。

Gaudi2提交的结果采用FP8数据类型,并在这种新数据类型上达到了99.9%的准确率。

随着每6-8周公布的Gaudi2软件更新,英特尔将继续在MLPerf基准测试中展现其产品的性能提升,以及持续扩大的模型覆盖范围。

wKgZomUEQpSAOHLSAAXSxMWr49Y014.png

Habana Gaudi2在GPT-J模型上的推理结果

验证了其具有竞争力的性能

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

关于第四代至强可扩展处理器的测试结果:

英特尔提交了基于第四代英特尔至强可扩展处理器的7个推理基准测试,其中包括GPT-J模型。结果显示,包括视觉、语言处理、语音和音频翻译模型,以及更大的DLRM v2深度学习推荐模型及ChatGPT-J模型在内,第四代至强处理器对于通用AI工作负载拥有出色的性能。此外,截至目前,英特尔仍是唯一一家使用行业标准的深度学习生态系统软件提交公开CPU结果的厂商

第四代英特尔至强可扩展处理器是通过流行的AI框架与库构建及部署通用AI工作负载的理想选择。对于GPT-J对约1000-1500字新闻稿进行100字总结的任务,第四代至强可扩展处理器可在离线模式下完成每秒两段的总结提要,在实时服务器模式下完成每秒一段的总结提要。

英特尔首次提交了英特尔至强CPU Max系列的MLPerf结果,该系列可提供高达64GB的高带宽内存。对于GPT-J而言,它是仅有的能够达到99.9%准确度的CPU,这对于对精度要求极高的应用来说至关重要。

英特尔与OEM厂商合作提交了测试结果,进一步展示了其AI性能的可扩展性,以及基于英特尔至强处理器的通用服务器的可获取性,充分满足客户服务水平协议(SLA)。

wKgZomUEQpWAFJSKAAO8Ll3VFIE534.png

第四代至强可扩展处理器

是构建及部署通用AI工作负载的理想选择

MLPerf是业内享有盛名的AI性能基准测试,旨在实现公平、可重复的产品性能比较。英特尔计划为下一个MLPerf测试提交新的AI训练性能结果。持续的性能更新彰显了英特尔致力于帮助客户、助力AI技术演进所迈出的每一步,无论是低成本的AI处理器,还是面向网络、云和企业用户的高性能AI硬件加速器或是GPU

注释:

  1. https://www.intel.com/content/www/us/en/newsroom/news/new-mlcommons-results-ai-gains-intel.html#gs.51njha

  2. https://huggingface.co/blog/bridgetower


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9425

    浏览量

    168834
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10445

    浏览量

    206566

原文标题:最新MLCommons结果公布 英特尔展现强大AI推理性能

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔登顶2023年全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    英特尔AMX助华栖云多场景AI推理性能大幅提升多达96倍

    AI技术应用已经深入到各行各业,特别是云服务提供商将AI能力集成到云服务中,能够更好地满足用户对性能、效率和体验的需求。
    的头像 发表于 01-13 10:46 579次阅读
    <b class='flag-5'>英特尔</b>AMX助华栖云多场景<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>大幅提升多达96倍

    英特尔专家为您揭秘第五代英特尔® 至强® 可扩展处理器如何为AI加速

    % 1 ,AI 推理性能提升42% 2 。 这一系列性能提升的背后,存在着怎样的创新与突破?第五代英特尔 至强 可扩展处理器为什么要强调为AI
    的头像 发表于 12-23 12:20 455次阅读

    CPU也可以完美运行大模型 英特尔第五代至强重磅发布

    处理器,它来了! 若是用一句话来概括它的特点,那就是——AI味道越发得浓厚。 以训练、推理大模型为例: •           与第四代相比,训练性能提升多达29%,推理性能提升高达4
    的头像 发表于 12-22 11:52 381次阅读
    CPU也可以完美运行大模型 <b class='flag-5'>英特尔</b>第五代至强重磅发布

    英特尔发布第五代至强可扩展处理器:性能和能效大幅提升,AI 加速

    此外,至强可扩展处理器被誉为行业首屈一指的内置AI加速器数据中心处理器,全新第五代产品更能优化参数量高达200亿的大型语言模型,使其推理性能提升42%。眼下,它还是唯一历次刷新MLPerf训练及推理基准测试表现记录并持续进步的C
    的头像 发表于 12-15 11:02 481次阅读

    用上这个工具包,大模型推理性能加速达40倍

    作者: 英特尔公司 沈海豪、罗屿、孟恒宇、董波、林俊 编者按: 只需不到9行代码, 就能在CPU上实现出色的LLM推理性能英特尔  Extension for Transformer 创新
    的头像 发表于 12-01 20:40 642次阅读
    用上这个工具包,大模型<b class='flag-5'>推理性能</b>加速达40倍

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    Nvidia 通过开源库提升 LLM 推理性能

    加利福尼亚州圣克拉拉——Nvidia通过一个名为TensorRT LLM的新开源软件库,将其H100、A100和L4 GPU的大型语言模型(LLM)推理性能提高了一倍。 正如对相同硬件一轮又一轮改进
    的头像 发表于 10-23 16:10 325次阅读

    最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上推理性能惊人

    英特尔产品在全新MLCommons AI推理性能测试中尽显优势 今日,MLCommons公布针对
    的头像 发表于 09-12 17:54 234次阅读
    最新MLPerf v3.1测试<b class='flag-5'>结果</b>认证,Gaudi2在GPT-J模型上<b class='flag-5'>推理性能</b>惊人

    求助,为什么将不同的权重应用于模型会影响推理性能

    生成两个 IR文件(相同的 .xml 文件,但不同的 .bin 文件) 具有不同重量的类似模型,以不同的 fps (27fps 和 6fps) 运行 更多样化的权重是否会影响 Myriad X 上的推理性能
    发表于 08-15 07:00

    如何提高YOLOv4模型的推理性能

    使用 PyTorch 对具有非方形图像的 YOLOv4 模型进行了训练。 将 权重转换为 ONNX 文件,然后转换为中间表示 (IR)。 无法确定如何获得更好的推理性能
    发表于 08-15 06:58

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理英特尔Xeon可扩展处理器约占运行AI
    发表于 08-04 07:25

    英特尔® AMX 助力百度ERNIE-Tiny AI推理性能提升2.66倍,尽释AI加速潜能

    科技赋能千行百业 人民网携手英特尔启动“数智加速度”计划 WAIC 2023:英特尔以技术之力推动边缘人工智能发展,打造数字化未来“芯”时代 英特尔 AMX 加速AI
    的头像 发表于 07-14 20:10 272次阅读
    <b class='flag-5'>英特尔</b>® AMX 助力百度ERNIE-Tiny <b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>提升2.66倍,尽释<b class='flag-5'>AI</b>加速潜能

    英特尔® AMX 加速AI推理性能,助阿里电商推荐系统成功应对峰值负载压力

    达沃斯论坛|英特尔王锐:AI驱动工业元宇宙,释放数实融合无穷潜力 英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图 英特尔
    的头像 发表于 07-08 14:15 331次阅读
    <b class='flag-5'>英特尔</b>® AMX 加速<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>,助阿里电商推荐系统成功应对峰值负载压力