0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

要长高 2024-09-26 16:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器,这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU,但英特尔巧妙地将竞争优势聚焦于其更为亲民的价格与总拥有成本(TCO)上。

Gaudi3处理器采用双芯片设计,内置强大的计算单元,包括64个张量处理器核心(TPC,配备256x256 MAC结构并集成FP32累加器)、8个高效的矩阵乘法引擎(MME,支持256位宽矢量处理)以及高达96MB的片上SRAM缓存,提供惊人的19.2TB/s带宽。此外,它还集成了24个200GbE网络接口和14个媒体引擎,后者能够高效处理多种视频编解码格式,如H.265、H.264、JPEG和VP9,为视觉处理应用增添强大助力。内存方面,Gaudi3搭载了128GB HBM2E内存,通过八个内存堆栈实现高达3.67TB/s的带宽,确保数据处理的高效流畅。

相较于前代产品Gaudi2,Gaudi3在架构上进行了显著优化,尽管在TPC和MME数量上有所精简,但它专注于提升特定精度下的计算能力,仅支持FP8矩阵运算及BFloat16矩阵和矢量运算,这一调整旨在更好地满足当前AI工作负载的需求。

在性能表现上,Gaudi3提供了高达1856 TFLOPS的BF16/FP8矩阵运算能力,以及28.7 TFLOPS的BF16矢量运算能力,同时其热设计功耗(TDP)约为600W。尽管在某些指标上略逊于英伟达H100,但英特尔强调,Gaudi3在实际应用中的性价比优势将尤为突出。

英特尔为Gaudi3制定了明确的市场定位,旨在与AMD的Instinct MI300系列及英伟达的H100、B100/B200等高端芯片展开竞争。据英特尔透露,基于8个Gaudi3芯片的加速器套件定价为125,000美元,单芯片成本约为15,625美元,相较于英伟达H100的30,678美元售价,展现了显著的价格优势。然而,面对可能具备更强性能的英伟达Blackwell架构GPU(如B100/B200),英特尔能否持续保持其竞争优势,仍需市场进一步验证。

英特尔执行副总裁Justin Hotard表示:“AI需求的激增正驱动数据中心领域的深刻变革,行业迫切需要更多元化的硬件、软件及开发工具选择。通过推出搭载P核与Gaudi3 AI加速器的Xeon 6,英特尔正积极构建一个开放的生态系统,助力客户以更高的性能、效率和安全性应对各种工作负载。”

目前,Gaudi3 AI加速器已通过IBM Cloud及英特尔Tiber开发者云平台提供服务,并计划于今年第四季度通过戴尔、慧与(HPE)和Supermicro等合作伙伴全面上市,其中戴尔和Supermicro的部分系统将于10月开始出货,而Supermicro的设备则将于12月抵达市场。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179344
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39715
  • AI
    AI
    +关注

    关注

    89

    文章

    38162

    浏览量

    296846
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    发力图形工作站和AI推理市场英特尔大显存GPU亮相湾芯展

    英特尔发布了面向专业的锐炫Pro B50和B60。这两款显卡比较RTX2000和5660Ti,有哪些性能上的优势?在支持AI推理工作站和大模型部署上,B60有哪些独到之处?10月16日
    的头像 发表于 10-22 13:40 1.1w次阅读
    发力图形工作站和<b class='flag-5'>AI</b>推理<b class='flag-5'>市场</b>,<b class='flag-5'>英特尔</b>大显存GPU亮相湾芯展

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔
    的头像 发表于 08-26 19:18 2590次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>Gaudi</b> 2E <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款
    的头像 发表于 06-27 11:44 609次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制与边缘智算一体机,创造“AI新视界”

    处理的边缘 AI 控制 和 基于英特尔锐炫 ™ 显卡的边缘智算一体机 ,为工业AI的规模化落地注入强劲动力。
    发表于 06-24 17:50 1391次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>发布</b>边缘<b class='flag-5'>AI</b>控制<b class='flag-5'>器</b>与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。
    的头像 发表于 06-20 17:32 713次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3
    的头像 发表于 05-21 00:57 6986次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理(GPU)和AI加速器产品系列。包括全新
    的头像 发表于 05-20 12:27 5174次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi
    发表于 05-20 11:03 1677次阅读

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    。三、市场地位与挑战行业格局:FPGA市场长期由AMD(Xilinx)和英特尔(Altera)主导,但收购后Altera市场份额从40%降至
    发表于 04-25 10:19

    部署成本显著降低!英特尔助阵高效AI算力一体机方案

    3月27日,英特尔举办了名为“‘至’绘未来,锐炫来袭”的创新解决方案研讨会,与生态伙伴共同分享最新AI算力一体机方案。该方案基于英特尔®至强® W处理
    的头像 发表于 03-29 16:29 1725次阅读
    部署<b class='flag-5'>成本</b>显著降低!<b class='flag-5'>英特尔</b>助阵高效<b class='flag-5'>AI</b>算力一体机方案

    英特尔借助开放生态系统,加速边缘AI创新

    英特尔推出全新AI边缘系统、边缘AI套件和开放边缘平台软件,赋能合作伙伴将AI无缝融入现有基础设施   英特尔
    发表于 03-21 11:31 302次阅读
    <b class='flag-5'>英特尔</b>借助开放生态系统,<b class='flag-5'>加速</b>边缘<b class='flag-5'>AI</b>创新

    英特尔发布最强大的商用AI PC产品阵容

    在2025年世界移动通信大会(MWC 2025)上,英特尔发布了该公司迄今为止最强大的商用AI PC产品阵容,搭载了英特尔 酷睿 Ultra 200V、200U、200H、200HX和
    的头像 发表于 03-08 09:28 990次阅读

    英特尔展示基于至强6处理的基础网络设施

      集成AI功能的英特尔至强6系统级芯片,与前几代产品相比,可带来高达2.4倍的无线接入网(RAN)容量提升1,和70%的每瓦性能提升2; 集成的人工智能加速器AI RAN性能提升了
    的头像 发表于 03-08 09:24 850次阅读

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司发布了备受瞩目的Janus Pro模型,其凭借超强性能和高精度在业界引发了广泛关注。为了进一步提升该模型的应用效能,英特尔宣布其Gaudi 2D AI
    的头像 发表于 02-10 11:10 929次阅读

    DeepSeek发布Janus Pro模型,英特尔Gaudi 2D AI加速器优化支持

    Gaudi 2D AI加速器现已针对该模型进行了全面优化。这一优化举措使得AI开发者能够更轻松地实现复杂任务的部署与优化,从而有效满足行业应用对于推理算力的迫切需求。
    的头像 发表于 02-08 14:35 915次阅读