0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔面向中国市场发布Gaudi2处理器,加速大模型训练和推理

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-07-17 00:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)日前,英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi深度学习加速器——HabanaGaudi2。英特尔在中国市场推出的Gaudi2AI加速器,将通过其合作伙伴浪潮提供给中国客户。

Gaudi2在训练和推理上的出色表现

英特尔此次推出的Gaudi2深度学习加速器暨Gaudi2夹层卡HL-225B,以第一代Gaudi高性能架构为基础,以多方位性能与能效比提升,加速高性能大语言模型运行。该加速器具备:

24个可编程Tensor处理器核心(TPCs)

21个100Gbps(RoCEv2)以太网接口

96GBHBM2E内存容量

2.4TB/秒的总内存带宽

48MB片上SRAM

集成多媒体处理引擎。

相比于国际版本,面向中国市场的Gaudi2每张芯片集成的专用于内部互联的100Gbps(RoCEv2RDMA)以太网接口,从24个减至21个。

英特尔HabanaLabs首席运营官EltanMedina对媒体表示,根据模型的不同,特供版Gaudi2性能会有轻微的影响,但在很多数据训练扩展中,并不是用这三个端口,整体性能差别不大。

根据英特尔的展示,相比于上一代产品,在ResNet-50模型测试中,Gaudi2训练吞吐量提高了3倍,BERT模型的训练吞吐量提高了4.7倍。目前,单个Gaudi2在ResNet-50模型可达到非常稳定的5800个图像/每秒的吞吐量。

英伟达相比,Gaudi2运行ResNet-50的每瓦性能约是英伟达A100的2倍,性价比相较于AWS云中基于英伟达的解决方案高出40%。英特尔表示,接下来到9月,采用FP8软件的Gaudi2预计能够提供比H100更高的性价比。

根据此前的报道,在测试GPT-3方面,Gaudi2也表现出了强劲性能,384个加速器上的训练时间为311分钟,从256个加速器到384个加速器实现近线性95%的扩展效果。

Gaudi2在大规模的多模态和语言模型的推理方面也表现出色。HuggingFace评估中,Gaudi2在运行StableDiffusion、70亿以及1760亿参数BLOOMz模型时,在行业内都保持领先水平。

英特尔在AI领域的布局

AI计算包括训练和推理,目前而言,在训练方面,英伟达的GPU长期占据主导地位。近段时间,大模型的热潮四起,英伟达的GPU明显供不应求。这让AMD、英特尔以及一些AI芯片初创企业看到了新的机会。

事实上英特尔在AI领域早有布局。2019年12月,英特尔斥资约20亿美元重金收购了成立于2016年的以色列人工智能(AI)芯片初创企业HabanaLabs。在此之前,英特尔还收购了FPGA厂商Altera、AI芯片公司Nervana。

在收购HabanaLabs后的几年中,英特尔加紧使Habana团队与英特尔内部业务整合。在2022年IntelVision活动上,英特尔推出第二代深度学习芯片HabanaGaudi2和HabanaGreco,分别用于AI训练和AI推理。也就是说,英特尔此次面向中国市场推出的新Gaudi2,也是在此前收购了HabanaLabs的基础上完成的。

面向AI领域的应用,英特尔有全面的芯片组合,包括CPU、GPU、FPGA、AI专用芯片等。英特尔公司执行副总裁数据中心与人工智能事业部总经理SandraRivera表示,Gaudi2作为用于AI加速的专用处理器,是英特尔产品组合适用于大模型负载中,性能最优的产品。

除了硬件方面,英特尔也非常注重在软件方面的优化,SandraRivera表示,英特尔致力于通过客户提供广泛的硬件选择,并支持开放的软件环境,加速人工智能技术的发展。

据英特尔介绍,为支持客户轻松构建模型,或将当前基于GPU的模型业务和系统迁移到基于全新Gaudi2服务器,并帮助保护软件开发投入,SynapseAI软件套件针对Gaudi平台深度学习业务进行了优化,旨在与广泛的软件生态系统一起,帮助简化模型的开发和迁移。

SynapseAI集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求。

对于英特尔来说,中国是一个很重要的市场,根据2022年数据,英特尔在中国的营收占到总营收的27%。如今中国的大模型发展如火如荼,而英伟达的A100/H100在中国禁售,特供版的A800/H800也需要获得许可才能出售。这对于英特尔来说,是一个很好的机会。

据悉,目前英特尔正与浪潮信息合作,打造并发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7,该服务器集成8颗Gaudi2加速卡HL-225B,还包含双路第四代英特尔至强可扩展处理器。此外,新华三、超聚变等公司,预计也将推出搭载Gaudi2的服务器。

小结

算力是AI大模型发展的重要基础,而AI芯片又是提供算力的重要组成部分。无论是训练还是推理,未来随着大模型的不断推进及应用落地,AI芯片的市场需求都将会持续上升。在英伟达一家独大的情况下,英特尔等厂商竞争力的不断提升,对整个产业的发展也更为有利。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20325

    浏览量

    254715
  • 英特尔
    +关注

    关注

    61

    文章

    10316

    浏览量

    181051
  • AI芯片
    +关注

    关注

    17

    文章

    2161

    浏览量

    36863
  • Gaudi2
    +关注

    关注

    0

    文章

    13

    浏览量

    295
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔炮轰,AMD回击!掌机市场芯片之争

    英特尔推出的才是专为掌机设计的最新处理器,信心源于新一代旗舰产品Panther Lake处理器。该处理器是首款基于英特尔18A工艺节点制造的
    的头像 发表于 01-12 09:09 5330次阅读

    英特尔至强6“芯”动GTC 2026,为英伟达DCG Rubin解锁系统级性能

    在英伟达GTC 2026大会上,英特尔正式宣布,英特尔至强 6处理器将作为主控处理器,应用于NVIDIA DGX Rubin NVL8 系统。这一举措充分彰显了在AI工作负载快速迈向大
    的头像 发表于 03-19 16:43 361次阅读

    性能再越级!英特尔推出全新酷睿Ultra 200HX Plus系列移动处理器

    英特尔酷睿Ultra 200HX Plus系列登场,全新酷睿 Ultra 9 290HX Plus和酷睿Ultra 7 270HX Plus处理器,为极致性能需求注入更强动力。 今日,英特尔
    的头像 发表于 03-19 16:43 299次阅读

    释放极致游戏性能!英特尔酷睿Ultra 200S Plus发布

    英特尔酷睿Ultra 200S Plus的内容创作性能至高可达同类产品的两倍,游戏性能平均提升 15%。其中,酷睿 Ultra 7 270K Plus 是英特尔迄今最快的台式机游戏处理器。 最新
    的头像 发表于 03-19 13:13 360次阅读

    英特尔与忆联重磅推出企业级网络存储解决方案

    白皮书,旨在充分发挥至强6处理器与忆联UH812a企业级SSD的性能潜力,全面满足AI训练推理场景下的高吞吐、高带宽及极致低延迟需求。
    的头像 发表于 02-02 09:14 1248次阅读
    <b class='flag-5'>英特尔</b>与忆联重磅推出企业级网络存储解决方案

    18A工艺首发!英特尔推出下一代PC处理器,77%游戏性能暴涨+180TOPS算力

    1月6日,在CES 2026上,英特尔发布了代号为Panther Lake 的全新 Core Ultra 3 系列处理器上市产品阵容。该系列处理器基于18A 制程节点打造的AI PC计
    的头像 发表于 01-07 07:56 2w次阅读
    18A工艺首发!<b class='flag-5'>英特尔</b>推出下一代PC<b class='flag-5'>处理器</b>,77%游戏性能暴涨+180TOPS算力

    发力图形工作站和AI推理市场英特尔大显存GPU亮相湾芯展

    英特尔发布面向专业的锐炫Pro B50和B60。这两款显卡比较RTX2000和5660Ti,有哪些性能上的优势?在支持AI推理工作站和大模型
    的头像 发表于 10-22 13:40 1.1w次阅读
    发力图形工作站和AI<b class='flag-5'>推理</b><b class='flag-5'>市场</b>,<b class='flag-5'>英特尔</b>大显存GPU亮相湾芯展

    工业算力怎么选?ZMC6000系列I3/I5/I7处理器,精准匹配不同工业场景需求!

    工控机的“算力”是工业自动化的关键。致远电子ZMC6000系列工业PC,配备英特尔I3、I5、I7处理器,满足不同场景的算力需求。本文将介绍这三款处理器的性能,看它们如何为工业场景赋能。前言在工业
    的头像 发表于 09-18 11:38 1293次阅读
    工业算力怎么选?ZMC6000系列I3/I5/I7<b class='flag-5'>处理器</b>,精准匹配不同工业场景需求!

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔
    的头像 发表于 08-26 19:18 3268次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E AI<b class='flag-5'>加速器</b>为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型
    的头像 发表于 08-07 14:42 1521次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大<b class='flag-5'>模型</b>

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核
    的头像 发表于 06-27 11:44 1006次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力AI系统高效运转

    英特尔发布边缘AI控制与边缘智算一体机,创造“AI新视界”

    处理器的边缘 AI 控制 和 基于英特尔锐炫 ™ 显卡的边缘智算一体机 ,为工业AI的规模化落地注入强劲动力。 英特尔与诺达佳联合发布边缘
    发表于 06-24 17:50 1564次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>发布</b>边缘AI控制<b class='flag-5'>器</b>与边缘智算一体机,创造“AI新视界”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔
    的头像 发表于 05-21 00:57 7720次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和AI性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系
    的头像 发表于 05-20 12:27 5621次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和AI性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3
    发表于 05-20 11:03 1911次阅读