0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

looger123 来源:looger123 作者:looger123 2024-09-06 15:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期,第五代英特尔®至强®可扩展处理器通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试(AISBench)。英特尔成为首批通过AISBench大语言模型(LLM)推理性能测试的企业。

中国电子技术标准化研究院赛西实验室依据国家标准《人工智能服务器系统性能测试规范》(征求意见稿)相关要求,使用AISBench2.0测试工具,完成了第五代英特尔至强可扩展处理器的AI大模型推理性能和精度测试。测试中,第五代英特尔至强在ChatGLM V2-6B(60亿参数)以及 Llama2-13B(130亿参数)两个模型上均展现出卓越推理性能,能够满足轻量级大语言模型的实时推理要求。

wKgZombasFCAOb28AAQWiisN-UI496.png

测试结果:此次单机性能测试中,在满足人类正常阅读速度要求(生成延迟小于100毫秒)的情况下,在封闭测试场景中构造数据集,基于第五代英特尔至强的服务器可实现:

在60亿参数的ChatGLM V2模型通用推理中,当输入输出序列为256时可达每秒2493 token的性能,当输入输出序列为2048时可达每秒926 token。

在130亿参数的Llama2模型通用推理中,当输入输出为256时可达每秒513 token,当输入输出序列为2048时可达每秒132 token1。


作为通用处理器,第五代英特尔至强在人工智能、网络、存储、数据库等关键工作负载均能提供出色性能。AISBench2.0的测试结果验证了英特尔至强在运行轻量级大语言模型时展现出的优异推理性能,使得客户可以使用基于至强的服务器,构建一个通用AI系统进行数据预处理、模型推理和部署,从而获得兼具AI性能、效率、准确性和可扩展性的组合。这也彰显了英特尔至强可以为企业提供“开箱即用”的功能,即可以在通用系统上部署一部分AI工作负载,从而为客户带来更佳的总体拥有成本(TCO)优势。

软硬结合,至强展现AI优势

英特尔至强的内置AI加速器使其成为在通用处理器上运行部分AI工作负载的理想解决方案,不仅如此,英特尔还配备了经过优化的、易于编程的开放软件,可降低客户和生态伙伴在数据中心部署从云到智能边缘各种基于AI的解决方案的门槛。

第五代英特尔至强可扩展处理器充分发挥了系统级优势(包括缓存、内存等),因此推理速度实现了大幅提升。

其内置的AI加速器——英特尔®高级矩阵扩展(AMX),通过提供专用的矩阵运算加速模块(TMUL),以及支持INT8和BF16这类低精度数据类型,可实现对计算资源的充分利用,从而大幅提升运算效率。

xFasterTransformer(简称xFT)是英特尔提供的在CPU平台上部署大语言模型的深度优化开放解决方案,通过C++Python两种API接口,更易于用户使用和将其集成到自有业务框架中。

关于AISBench

AISBench基准是一套应用于人工智能计算产品的性能测试基准,由中国电子技术标准化研究院牵头研制。与MLPerf等国际先进计算基准类似,该基准用于测试多种人工智能计算产品形态,并支持丰富的测试场景、模式、类型和指标。

产品与性能信息

1.服务器:在搭载第五代英特尔®至强®处理器的Quanta Cloud Technology 服务器 QuantaGrid D54Q-2U上测量,CPU:英特尔至强铂金8592+、64核,超线程开启、睿频开启、NUMA 4,内存:1.5 TB、硬盘:Intel P5800X 3.2TB NVME ,、操作系统:Ubuntu 22.04、测试软件:AISBench、深度学习框架:PyTorch 2.3.1、模型数据精度:BF16。英特尔于2024年6月26日至7月26日进行测试。

客户端:第十一代英特尔®酷睿™i7-1185G7:在戴尔Latitude 7420上测量,内存:16.0 GB、硬盘:256 GB、操作系统:Microsoft Windows 11Enterprise、测试软件:MobaXtermPersonalEdition v22.0 Build 4858。英特尔于2024年6月26日至7月26日进行测试。

测试工具:性能测试工具AISBench 2.0。

免责声明

性能因使用情况、配置和其他因素而异。欲了解更多信息,请访问性能指数网站。性能结果基于截至所示日期的测试,可能无法反映所有公开可用的更新。请参阅备份以了解配置详情。没有任何产品或组件是绝对安全的。您的成本和结果可能会有所不同。英特尔技术可能需要启用硬件、软件或激活服务。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10324

    浏览量

    181103
  • 至强处理器
    +关注

    关注

    0

    文章

    23

    浏览量

    9354
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:英特尔® 至强
    的头像 发表于 04-26 16:27 7430次阅读
    AI工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,双芯联动重塑AI工作站格局

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,推出英特尔® 至强® 600工作站处理器英特尔锐炫™ Pro B70、B65
    的头像 发表于 04-24 09:28 4514次阅读
    <b class='flag-5'>英特尔</b>发布<b class='flag-5'>至强</b>600系列工作站<b class='flag-5'>处理器</b>与锐炫Pro B70 GPU,双芯联动重塑AI工作站格局

    探秘ISL95813评估板:为英特尔处理器打造的高性能电源解决方案

    探秘ISL95813评估板:为英特尔处理器打造的高性能电源解决方案 作为电子工程师,我们常常在寻找能够为英特尔处理器提供高效、稳定电源的
    的头像 发表于 04-13 15:40 164次阅读

    英特尔至强6“芯”动GTC 2026,为英伟达DCG Rubin解锁系统级性能

    在英伟达GTC 2026大会上,英特尔正式宣布,英特尔至强 6处理器将作为主控处理器,应用于NVIDIA DGX Rubin NVL8 系统
    的头像 发表于 03-19 16:43 399次阅读

    性能再越级!英特尔推出全新酷睿Ultra 200HX Plus系列移动处理器

    英特尔酷睿Ultra 200HX Plus系列登场,全新酷睿 Ultra 9 290HX Plus和酷睿Ultra 7 270HX Plus处理器,为极致性能需求注入更强动力。 今日,英特尔
    的头像 发表于 03-19 16:43 343次阅读

    释放极致游戏性能英特尔酷睿Ultra 200S Plus发布

    英特尔酷睿Ultra 200S Plus的内容创作性能至高可达同类产品的两倍,游戏性能平均提升 15%。其中,酷睿 Ultra 7 270K Plus 是英特尔迄今最快的台式机游戏
    的头像 发表于 03-19 13:13 400次阅读

    18核/24核双旗舰!英特尔酷睿Ultra 200S Plus发布,游戏性能大涨15%

    在桌面处理器领域,英特尔开启了新品发布。3月11日晚间,英特尔发布全新英特尔酷睿Ultra 200S plus系列,包含270K Plus和 250K Plus。新款 Plus
    的头像 发表于 03-12 16:27 1.1w次阅读
    18核/24核双旗舰!<b class='flag-5'>英特尔</b>酷睿Ultra 200S Plus发布,游戏<b class='flag-5'>性能</b>大涨15%

    18A工艺首发!英特尔推出下一代PC处理器,77%游戏性能暴涨+180TOPS算力

    1月6日,在CES 2026上,英特尔发布了代号为Panther Lake 的全新 Core Ultra 3 系列处理器上市产品阵容。该系列处理器基于18A 制程节点打造的AI PC计算平台,代表了
    的头像 发表于 01-07 07:56 2w次阅读
    18A工艺首发!<b class='flag-5'>英特尔</b>推出下一代PC<b class='flag-5'>处理器</b>,77%游戏<b class='flag-5'>性能</b>暴涨+180TOPS算力

    全球首款落地!英特尔携手新华三等合作伙伴,重磅推出全域液冷服务

    11月19日,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔至强6900系列性能处理器的双路冷板式全域
    的头像 发表于 11-25 09:17 1.1w次阅读
    全球首款落地!<b class='flag-5'>英特尔</b>携手新华三等合作伙伴,重磅推出全域液冷服务<b class='flag-5'>器</b>

    从云到端:英特尔展示全栈AI能力,覆盖云、边、PC多场景

    2025年9月25日,杭州——今日,在2025云栖大会上,英特尔与阿里云带来了多项云基础设施创新成果,包括兼容多代际服务(支持第五代英特尔® 至强® 可扩展
    的头像 发表于 09-26 17:27 1759次阅读
    从云到端:<b class='flag-5'>英特尔</b><b class='flag-5'>展示</b>全栈AI能力,覆盖云、边、PC多场景

    英特尔288核新至强处理器揭秘:Intel 18A制程,3D堆叠与键合,EMIB封装……

      近日,在Hot Chips 2025大会举行期间,英特尔新一代至强处理器 Clearwater Forest首次亮相,这是英特尔基于Intel 18A制程打造的首款服务
    的头像 发表于 08-29 15:59 2014次阅读

    英特尔至强6助力阿里云第九代企业级ECS实例100天赢得超万家客户青睐

    近日,搭载英特尔® 至强® 6性能处理器的阿里云第九代企业级ECS实例g9i正式迎来商业化100天里程碑,并获得超过10,000家客户的信赖与选择。通过全场景的
    的头像 发表于 07-29 15:44 698次阅读

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能处理器,其中一款677
    的头像 发表于 06-27 11:44 1033次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6助力AI系统高效运转

    术业有专攻——AI系统主控CPU英特尔至强6新品处理器浅析

    一、至强6与NVIDIA GPU 协同的硬件基础 在 AI 异构计算架构中,英特尔至强6处理器作为主控CPU可以与NVIDIA最新GPU 很好地协同。根据英伟达官网信息,目前其DGX
    的头像 发表于 06-19 16:37 940次阅读
    术业有专攻——AI系统主控CPU<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6新品<b class='flag-5'>处理器</b>浅析

    英特尔发布全新GPU,AI和工作站迎来新选择

    Computex 2025上,英特尔发布了为专业人士和开发者设计的全新图形处理器(GPU)和AI加速产品系列。包括: 全新英特尔锐炫 ™ Pro B 系列 GPU :
    发表于 05-20 11:03 1917次阅读