0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔Gaudi 3 AI芯片:5nm工艺设计,训练推理皆强

微云疏影 来源:综合整理 作者:综合整理 2024-04-10 11:10 次阅读

4 月 9 日,英特尔在 Vision 2024 大会上公布最新一代 Gaudi 3 AI 芯片并宣布将于同年第三季度批量上市。相较于英伟达 H100,Gaudi 3 训练性能提升 170%,推理能力增幅 50%,效率提升 40%,而成本显著降低。

此外,英特尔在发布会上还宣布更改旗下数据中心CPU产品名称:原“Granite Rapids”和“Sierra Forest”将更名为“Xeon 6”系列。新品预计今年发售,并支持性能提升后的标准化 MXFP4 数据格式。

除此之外,英特尔正研发适用于以太网的 AI NIC ASIC 及 AI NIC 小芯片。这两款产品尤其适合于其未来的 XPU 和 Gaudi 3 处理器,有望通过英特尔代工厂对外销售。有关网络产品的详细信息尚未公开。

据悉,Gaudi 3 采用 5nm 制程,FP8性能较前代翻番,BF16性能增大至四倍,网络带宽增加一倍,内存带宽扩大约 1.5 倍,能够提供Mezz卡、板载以及PCIe三种形式。

Gaudi 3拥有64个第五代张量处理核心和8个矩阵计算引擎,并配备128GBHBM内存和96MBSRAM。设计有24条200GBERoCE标准以太网总线和最多16条PCIe5.0总线。

在板载版,聚类产品型号为HLB-325。由八块Gaudi 3 Mezz卡组成的模块提供约14.6PFLOPS的FP8性能,极大的带宽速率达29.6TB/s的HBM2e内存,64个线性计算引擎,192条200GBE网络总线和上述所有。

在PCIe版本,型号为HL-338的卡具有单卡达1835TFLOPS的FP8峰值性能,128GBHBM2e内存,8个线性计算引擎,24条200GBE网络总线,功率消耗600W,占两卡槽的整体空间高度。

一个由8个Gaudi 3 AI加速器构成的节点可提供14.7PF FP8计算性能,128GB的内存,8.4TB/s的网络读写速度,而64个节点的集群(512个AI加速器)能提供的最大计算性能为7.52EF FP8,525.3TB的内存和614TB/s的网络读写速度。更高的,1024个节点的集群可以达到15EF FP8的计算性能,1PB的内存和1,229PB每秒的网络读写速度。

在实际测试中,与英伟达的主流产品H100比较,Gaudi 3在相同节点数时的平均训练时间要高出约1.7倍,LLAMA2 70亿的模型参数的情况下超过了H100的1.5倍,对于LLAMA2 130亿参数的模型,Gaudi 3在最高时也超过了H100的1.7倍,同样,GPT 3已达到1750亿参数,且Gaudi 3在推理速度和能效表现上均优

英特尔近日发布了其下一代 GPU 路线规划——Gaudi 3,包括风冷和液冷版本,计划于明年三至四季度相继批量交付。Gaudi 3 由戴尔、惠普、联想及超微等众多合作伙伴负责生产和销售,据称下半年有望登陆英特尔自家的云服务——Developer Cloud。除了 Gaudi 3,英特尔还向我们展示了公司在各层面的 AI 产品线的最新进展。

为了更好地优化 AI 的表现,英特尔发布了全新的 Xeon 6 处理器,主要用于大模型的训练。Xeon 6 采用了高效能的 E-core 核心和高性能的 P-core 核心,其中 E-core 核心代号为 Sierra Forest,能效较前一代提升了整整两倍半,而 P-core 则代号为 Granite Rapids,支持 MXFP4。值得一提的是,比起前一代 Xeon 处理器,Xeon 6 的机身架构扩展了整整 2.7 倍,已经开始被许多用户用来升级老旧设备,以此达到节能减排的目的。

值得一提的还有物联网的应用。今年,英特尔预计将共售出超过 4000 万台基于酷睿 Ultra 处理器的 AI PC,除了消费级市场,AI 也正逐渐走进人们生活的方方面面,如工业制造、医疗健康等领域。据悉,该公司将于年内发布一系列新的边缘芯片,这些产品将涵盖酷睿 Ultra、酷睿、凌动处理器和 Arc GPU,旨在覆盖多个不同行业的应用需求。

另外,英特尔还透露计划此次与Ultra Ethernet Consortium合作,推出一种名为 AI Ethernet 的网络解决方案,专门解决海量数据迁移中的网络拥堵问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9428

    浏览量

    168897
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10451

    浏览量

    206583
  • 数据中心
    +关注

    关注

    15

    文章

    4189

    浏览量

    70116
收藏 人收藏

    评论

    相关推荐

    英特尔拟推出中国市场“特供版芯片Gaudi 3

    英特尔计划在中国市场推出“特供版”Gaudi 3 AI芯片,这一决策主要是基于美国对于AI芯片
    的头像 发表于 04-16 14:48 200次阅读

    英特尔进军AI芯片市场:推出Gaudi 3 AI加速卡与Xeon 6处理器

    Gaudi 3作为英特尔AI领域的最新力作,旨在与英伟达等市场领导者展开竞争。据英特尔透露,这款芯片在能效和
    的头像 发表于 04-10 15:37 429次阅读

    英特尔发布人工智能芯片新版,对标Nvidia

    为应对AI行业对高性能芯片的巨大需求,英特尔推出了全新Gaudi 3芯片,据称这一款芯片
    的头像 发表于 04-10 09:26 108次阅读

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔再创辉煌!1.4nm芯片工艺领航微电子时代,工业界的新里程碑?

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月26日 08:58:21

    英特尔Gaudi 3系列AI加速器明年上市

    英特尔总裁帕特·基辛格(Pat Gelsinger)认为,鉴于英特尔Gaudi3具备的持续加强的性能优势和极具竞争性的TCO及定价机制,预测该产品有望在2024年凭借领先的AI加速器套
    的头像 发表于 12-15 11:07 434次阅读

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    有消息透露称,英特尔Gaudi 2处理器订单增多,Gaudi 3预计明年上市

    此前有消息称,今年 7月,英特尔面向中国市场推出了一款全新的 Gaudi2处理器,主要应用于加速 AI训练推理。而今这款“特供版”
    的头像 发表于 09-20 10:50 675次阅读

    最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上推理性能惊人

    测试结果,其中包括英特尔所提交的基于Habana® Gaudi®2 加速器、第四代英特尔®至强®可扩展处理器,以及英特尔®至强® CPU Max 系列的测试结果。该结果显示了
    的头像 发表于 09-12 17:54 237次阅读
    最新MLPerf v3.1测试结果认证,<b class='flag-5'>Gaudi</b>2在GPT-J模型上<b class='flag-5'>推理</b>性能惊人

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理英特尔Xeon可扩展处理器约占运行
    发表于 08-04 07:25

    大模型算力新选择——宝德AI服务器采用8颗英特尔Gaudi®2加速器

    近日,英特尔专门针对中国市场推出深度学习加速器Habana® Gaudi®2.以领先的性价比优势,加速AI训练推理,提高深度学习性能和效率
    的头像 发表于 07-19 14:43 498次阅读

    英特尔面向中国市场发布Gaudi2处理器,加速大模型训练推理

    推出的GaudiAI加速器,将通过其合作伙伴浪潮提供给中国客户。   Gaudi2在训练推理上的出色表现  
    的头像 发表于 07-17 00:01 1286次阅读
    <b class='flag-5'>英特尔</b>面向中国市场发布<b class='flag-5'>Gaudi</b>2处理器,加速大模型<b class='flag-5'>训练</b>和<b class='flag-5'>推理</b>

    英特尔全新Gaudi2处理器面世中国市场,加速大规模深度学习训练推理

    Gaudi2致力于以领先的性价比优势,加速AI训练推理,为中国用户提供更高的深度学习性能和效率,从而成为大规模部署AI的更优解。
    的头像 发表于 07-14 20:10 385次阅读
    <b class='flag-5'>英特尔</b>全新<b class='flag-5'>Gaudi</b>2处理器面世中国市场,加速大规模深度学习<b class='flag-5'>训练</b>与<b class='flag-5'>推理</b>

    【机器视觉】欢创播报 | 英特尔发布Gaudi2争夺AI芯片市场

    1 英特尔发布Gaudi2争夺AI芯片市场 7月11日,英特尔面向中国市场推出了AI
    的头像 发表于 07-13 11:21 386次阅读

    为深度学习而生,英特尔全新Gaudi2处理器正式登陆中国

    英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi深度学习加速器——Habana®
    的头像 发表于 07-13 09:48 548次阅读