0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新MLCommons结果公布 英特尔展现强大AI推理性能

英特尔中国 来源:未知 2023-09-15 19:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,MLCommons公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的MLPerf推理v3.1性能基准测试结果,其中包括英特尔所提交的基于HabanaGaudi2加速器、第四代英特尔至强可扩展处理器,以及英特尔至强CPU Max系列的测试结果。该结果显示了英特尔在AI推理方面极具竞争力的表现,并进一步加强了其对加速从云到网络到边缘再到端的工作负载中大规模部署AI的承诺。

正如最新的MLCommons结果显示,我们拥有强大的、具有竞争力的人工智能产品组合以满足客户对高性能、高效率的深度学习推理及训练的需求,同时,针对各种规模的人工智能模型,英特尔产品组合均具有领先的性价比优势。

--Sandra Rivera

英特尔执行副总裁

兼数据中心与人工智能事业部总经理

根据6月披露的MLCommonsAI训练结果1和Hugging Face性能基准测试2验证,Gaudi2在先进的视觉语言模型上拥有卓越的性能,而今天的结果进一步证明了英特尔能够提供满足AI计算需求的绝佳解决方案。

考虑到客户的个性化需求,英特尔正在通过能够帮助解决AI工作负载中推理与训练问题的产品,让AI无处不在。英特尔的AI产品为客户提供了可根据各自性能、效率及目标成本进行灵活匹配以获取最佳AI解决方案的理想选择,同时亦帮助客户开放生态系统。

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

关于Habana Gaudi2的测试结果:

Habana Gaudi2在GPT-J模型上的推理结果强有力地验证了其具有竞争力的性能。

Gaudi2在GPT-J-99和GPT-J-99.9上的服务器查询和离线样本的推理性能分别为78.58次/秒和84.08次/秒。

Gaudi2提交的结果采用FP8数据类型,并在这种新数据类型上达到了99.9%的准确率。

随着每6-8周公布的Gaudi2软件更新,英特尔将继续在MLPerf基准测试中展现其产品的性能提升,以及持续扩大的模型覆盖范围。

wKgZomUEQpSAOHLSAAXSxMWr49Y014.png

Habana Gaudi2在GPT-J模型上的推理结果

验证了其具有竞争力的性能

wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif

关于第四代至强可扩展处理器的测试结果:

英特尔提交了基于第四代英特尔至强可扩展处理器的7个推理基准测试,其中包括GPT-J模型。结果显示,包括视觉、语言处理、语音和音频翻译模型,以及更大的DLRM v2深度学习推荐模型及ChatGPT-J模型在内,第四代至强处理器对于通用AI工作负载拥有出色的性能。此外,截至目前,英特尔仍是唯一一家使用行业标准的深度学习生态系统软件提交公开CPU结果的厂商。

第四代英特尔至强可扩展处理器是通过流行的AI框架与库构建及部署通用AI工作负载的理想选择。对于GPT-J对约1000-1500字新闻稿进行100字总结的任务,第四代至强可扩展处理器可在离线模式下完成每秒两段的总结提要,在实时服务器模式下完成每秒一段的总结提要。

英特尔首次提交了英特尔至强CPU Max系列的MLPerf结果,该系列可提供高达64GB的高带宽内存。对于GPT-J而言,它是仅有的能够达到99.9%准确度的CPU,这对于对精度要求极高的应用来说至关重要。

英特尔与OEM厂商合作提交了测试结果,进一步展示了其AI性能的可扩展性,以及基于英特尔至强处理器的通用服务器的可获取性,充分满足客户服务水平协议(SLA)。

wKgZomUEQpWAFJSKAAO8Ll3VFIE534.png

第四代至强可扩展处理器

是构建及部署通用AI工作负载的理想选择

MLPerf是业内享有盛名的AI性能基准测试,旨在实现公平、可重复的产品性能比较。英特尔计划为下一个MLPerf测试提交新的AI训练性能结果。持续的性能更新彰显了英特尔致力于帮助客户、助力AI技术演进所迈出的每一步,无论是低成本的AI处理器,还是面向网络、云和企业用户的高性能AI硬件加速器或是GPU

注释:

  1. https://www.intel.com/content/www/us/en/newsroom/news/new-mlcommons-results-ai-gains-intel.html#gs.51njha

  2. https://huggingface.co/blog/bridgetower


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179260
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222889

原文标题:最新MLCommons结果公布 英特尔展现强大AI推理性能

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    发力图形工作站和AI推理市场,英特尔大显存GPU亮相湾芯展

    英特尔发布了面向专业的锐炫Pro B50和B60。这两款显卡比较RTX2000和5660Ti,有哪些性能上的优势?在支持AI推理工作站和大模型部署上,B60有哪些独到之处?10月16日
    的头像 发表于 10-22 13:40 1.1w次阅读
    发力图形工作站和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>市场,<b class='flag-5'>英特尔</b>大显存GPU亮相湾芯展

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户端计算事
    的头像 发表于 06-20 17:32 693次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和
    的头像 发表于 05-20 12:27 5144次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    Pro B50 GPU,搭载了为AI推理和专业工作站量身定制的配置,扩展了英特尔锐炫Pro产品系列。 英特尔 ® Gaudi 3 AI 加速
    发表于 05-20 11:03 1664次阅读

    1.9倍性能提升!英特尔至强6在MLPerf基准测试中表现卓越

    与第五代至强处理器相比,英特尔至强6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf
    的头像 发表于 04-07 10:58 509次阅读

    部署成本显著降低!英特尔助阵高效AI算力一体机方案

    3月27日,英特尔举办了名为“‘至’绘未来,锐炫来袭”的创新解决方案研讨会,与生态伙伴共同分享最新AI算力一体机方案。该方案基于英特尔®至强® W处理器和多个英特尔锐炫™显卡,可为日益
    的头像 发表于 03-29 16:29 1712次阅读
    部署成本显著降低!<b class='flag-5'>英特尔</b>助阵高效<b class='flag-5'>AI</b>算力一体机方案

    英特尔发布最强大的商用AI PC产品阵容

    处理器。在台式机和移动设备形态中,该产品组合为全球企业提供包含计算性能、能效、连接性、安全性和可管理性的全面解决方案。 如今是PC更新换代的关键节点,凭借英特尔 酷睿 Ultra处理器(第二代),我们为客户带来了
    的头像 发表于 03-08 09:28 982次阅读

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    英特尔至强6助力HPE Gen12,AI推理性能提升3倍!

    ,CPU处理器永远都是C位的存在,没有它的基础性支撑,其他一切都是空中楼阁。 当然,CPU处理器也在积极适应新的时代趋势,既要不断增强计算性能,也要低碳环保提高能效,但它们俩如同硬币的正反面,不可能完美兼顾,那该怎么办呢? 对此,英特尔的解决方案是兵分
    的头像 发表于 02-18 14:18 529次阅读
    <b class='flag-5'>英特尔</b>至强6助力HPE Gen12,<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>提升3倍!

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型进行了深度优化。 这一优化举措使得AI开发者能够以更低的成本和更高的效率实现复杂任务的部署与优化。英特尔Gaudi 2D AI加速器通过其卓越的计算能力和高度优化的软件栈,为Janus Pro模型提供了
    的头像 发表于 02-10 11:10 925次阅读

    使用NVIDIA推理平台提高AI推理性能

    NVIDIA推理平台提高了 AI 推理性能,为零售、电信等行业节省了数百万美元。
    的头像 发表于 02-08 09:59 1310次阅读
    使用NVIDIA<b class='flag-5'>推理</b>平台提高<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    英特尔酷睿Ultra 200V系列移动处理器亮相CES 2025

    基于英特尔 vPro 平台的全新英特尔 酷睿 Ultra 200V系列移动处理器,为企业提供 AI 驱动的生产力和提升的IT管理能力1。该产品不仅拥有卓越的性能、效率和非凡的商务计算能
    的头像 发表于 01-20 09:21 1685次阅读

    英特尔塑造未来出行:AI增强型软件定义汽车

    的车载体验,将未来出行变为现实。 英特尔的展示不仅展现了其技术的卓越与先进,更是对未来汽车体验的一次生动呈现。AI增强型SDV(软件定义汽车)平台是英特尔这一愿景的核心,该平台融合了高
    的头像 发表于 01-14 11:20 886次阅读

    MLCommons推出AI基准测试0.5版

    开放式机器学习工程联盟 MLCommons 在美国加州当地时间公布推出适用于消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版,这是该测试的第一个公开版
    的头像 发表于 12-12 16:47 1199次阅读

    英特尔推出全新英特尔锐炫B系列显卡

    备受玩家青睐的价格提供卓越的性能与价值1,很好地满足现代游戏需求,并为AI工作负载提供加速。其配备的英特尔Xe矩阵计算引擎(XMX),为新推出的XeSS 2提供强大支持。XeSS 2的
    的头像 发表于 12-07 10:16 1918次阅读
    <b class='flag-5'>英特尔</b>推出全新<b class='flag-5'>英特尔</b>锐炫B系列显卡