0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔推出AI加速器性价比产品Gaudi2

IT葡萄皮 来源:IT葡萄皮 2023-07-14 16:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,英特尔面向中国市场发布了HabanaGaudi2深度学习加速卡器。

新的Gaudi2直接给到了24个Tensor处理核心(TPC),是上代产品的三倍;而在对大模型应用至关重要的显存方面,Gaudi2也大方的配置了96GBHBM2e,显存带宽直接达到了2.4TB/s。而在连接方式上,Gaudi2则采用了OCPOAM接口形式,可扩展出21个100G以太网连接,并支持RoCE(RDMAover Converged Ethernet)v2。同时,Gaudi2还集成了多媒体处理器引擎和48MB片上SRAM作为高速缓存。

在系统层面,英特尔则提供能够同时安装8块Gaudi2的夹层基板,同样遵循OCP标准,可扩展出24个100GRoCE网络接口。

性能更好的新选择

Gaudi2搭载的96GBHBM显存的确令人眼前一亮,但真正能够影响用户购买行为的仍旧似乎加速卡本身的计算性能。

在HuggingFace工程师RégisPierrard去年底进行的Gaudi2测试中,Gaudi2不仅在与前代产品的对比中表现出了近乎线性的性能提升,更大幅超越了对标的A100加速卡。

5261f29a-2220-11ee-962d-dac502259ad0.png

BERT预训练,8卡

Gaudi2使用bf16/fp32混合精度,A100使用fp16精度

526f3b26-2220-11ee-962d-dac502259ad0.png

StableDiffusion测试,单卡

从RégisPierrard使用IntelDeveloper Cloud进行的两轮测试中我们不难发现,无论是在BERT这样的大模型应用中,还是在StableDiffusion这样的“传统”AIGC应用中,Gaudi2的性能表现均相当亮眼;相对于前代产品展现出了至少3倍的性能优势(Gaudi2的TPC数量是前代的3倍),且比对标的A100产品更具性能优势。

在两项测试中,Gaudi2均使用了英特尔推出的SynapseAI1.10套件和OptimumHabana1.6;其中前者是面向Gaudi系列加速卡的SDK开发套件,能够对TensorFlow和Pytorch等流行框架提供支持,而后者则是专门面向Transformers和Diffusers优化的运行库。

同时,在发布会的现场演示环节,英特尔工作人员展示了StableDiffusion应用中1至64张卡的计算性能,并实现了99%的近线性性能扩展。换而言之,在更大规模的业务部署当中,Gaudi2也能通过集群横向扩展获得更加线性的性能增长。

目前,Gaudi系列AI加速器已经在AWS的EC2DL1主机中进行了实际的商业部署。AWS表示,相对于传统GPU,Gaudi能够在深度学习应用中带来40%的性价比提升。

在走量的市场做走心的产品

诚然,Gaudi2的竞品并非性能无两的H100,更无法对即将面市的H100NVL构成性能威胁。但对于更加“走量”的A100而言,Gaudi2所展现出的性价比则对大多数用户而言更有价值。

近两年,“从中端入局”似乎已经成为英特尔的惯用手段,消费级的Arc770显卡和如今的Gaudi2均如此。

走量的中端市场对英特尔有足够的吸引力,也更容易帮助英特尔用一两款产品就建立口碑、站稳脚跟;同时,能在中端市场为用户提供先进技术和优势性价比也证明英特尔对目标用户足够走心,愿意把真正的实惠带给最广阔的用户市场。

在走量的市场做走心的产品,这样的英特尔令人喜闻乐见。

为Ai加速器市场打开一扇窗

近两年,以AIGC为代表的AI应用快速崛起,吸引了科技圈和投资界的广泛关注,其中的语言类大模型更有望大幅降低企业在营销、客服和售后方面的成本,实现生产效率的大幅提升。

在科技企业争相进行大模型“军备竞赛”的背后,GPU的需求也水涨船高。在GPU市场格局高度固化的当下,这一现象很容易带来终端市场的价格起伏,导致GPU价格畸高,进而推高企业投身AI业务的成本并导致基础架构被绑定。

而英特尔Gaudi2加速卡的出现则意味着企业有了全新选择。一方面,Gaudi2在绝对性能、显存容量、集群性能等方面都比对标产品有优势,能够承接现有的市场需求;另一方面,伴随oneAPI等算力调用工具的不断成熟和完善,用户也能在开发和应用层面实现基础架构的透明化,更轻松的调用多元算力,继而获得算力和基础架构层面的灵活性。

528258aa-2220-11ee-962d-dac502259ad0.png

作为AI加速器市场的“追赶者”,Gaudi2证明英特尔能够为用户提供有竞争力的先进产品。当然,这还仅是在“独立AI加速器”这一条赛道中。

在更广阔的数据中心赛道中,英特尔还有并行的DataCenter Max和DataCenterFlex两条产品线,以及更加独立的FPGA赛道。此外,英特尔也在积极推动AI能力与传统CPU的结合。从最初的AVX-512指令集和DLBoost到如今AMX-512指令集,英特尔正在为用户构建一条“用CPU灵活处理AI推理业务”的全新路径。

很显然,在英特尔的眼中,用户在未来应该针对不同场景和不同业务负载来规划不同的基础架构,用不同算力来满足业务需求。而伴随oneAPI的逐步成熟,底层算力的区别将被抹除,模型训练和多端部署不再需要特别调优就能实现无缝迁移和高效调优。

在产品层面,英特尔最新推出的Gaudi2对用户而言有足够的吸引力;在战略层面,Gaud2则是英特尔站稳独立AI加速器市场并构筑多元算力体系的重要一步。而在AI研究快速推进,技术落地如火如荼的当下,Gaudi2的出现无疑为用户带来了全新选择;而奋力前行的英特尔更有望为市场带来AI与算力需求之间的全新平衡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179317
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39712
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296680
  • Gaudi2
    +关注

    关注

    0

    文章

    13

    浏览量

    256

原文标题:先得走心,才能走量!英特尔推出AI加速器性价比产品Gaudi2

文章出处:【微信号:IT葡萄皮,微信公众号:IT葡萄皮】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    18A工艺大单!英特尔将代工微软AI芯片Maia 2

    电子发烧友网综合报道 据科技媒体SemiAccurate报道,微软已正式向英特尔晶圆代工(Intel Foundry)下达订单,委托其使用先进的18A工艺节点生产下一代AI加速器Maia 2
    的头像 发表于 10-21 08:52 4661次阅读

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔
    的头像 发表于 08-26 19:18 2586次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理,其中一款677
    的头像 发表于 06-27 11:44 605次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制与边缘智算一体机,创造“AI新视界”

    处理的边缘 AI 控制 和 基于英特尔锐炫 ™ 显卡的边缘智算一体机 ,为工业AI的规模化落地注入强劲动力。
    发表于 06-24 17:50 1391次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制<b class='flag-5'>器</b>与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    CTO、高级首席AI工程师张宇博士 英特尔客户端计算事业部边缘计算CTO、高级首席AI工程师张宇博士在MWC AI终端峰会上指出,边缘将崛起为AI
    的头像 发表于 06-20 17:32 708次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品英特尔Gaudi 3
    的头像 发表于 05-21 00:57 6971次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理(GPU)和AI加速器产品系列。包括全新
    的头像 发表于 05-20 12:27 5161次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3
    发表于 05-20 11:03 1668次阅读

    英特尔借助开放生态系统,加速边缘AI创新

    英特尔推出全新AI边缘系统、边缘AI套件和开放边缘平台软件,赋能合作伙伴将AI无缝融入现有基础设施  
    发表于 03-21 11:31 302次阅读
    <b class='flag-5'>英特尔</b>借助开放生态系统,<b class='flag-5'>加速</b>边缘<b class='flag-5'>AI</b>创新

    英特尔发布最强大的商用AI PC产品阵容

    处理。在台式机和移动设备形态中,该产品组合为全球企业提供包含计算性能、能效、连接性、安全性和可管理性的全面解决方案。 如今是PC更新换代的关键节点,凭借英特尔 酷睿 Ultra处理
    的头像 发表于 03-08 09:28 988次阅读

    英特尔展示基于至强6处理的基础网络设施

      集成AI功能的英特尔至强6系统级芯片,与前几代产品相比,可带来高达2.4倍的无线接入网(RAN)容量提升1,和70%的每瓦性能提升2; 集成的人工智能
    的头像 发表于 03-08 09:24 846次阅读

    MWC 2025:英特尔展示基于至强6处理的基础网络设施

    新闻亮点 集成AI功能的英特尔至强6系统级芯片,与前几代产品相比,可带来高达2.4倍的无线接入网(RAN)容量提升1,和70%的每瓦性能提升2; 集成的人工智能
    发表于 03-03 15:52 970次阅读
    MWC 2025:<b class='flag-5'>英特尔</b>展示基于至强6处理<b class='flag-5'>器</b>的基础网络设施

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司发布了备受瞩目的Janus Pro模型,其凭借超强性能和高精度在业界引发了广泛关注。为了进一步提升该模型的应用效能,英特尔宣布其Gaudi 2D AI
    的头像 发表于 02-10 11:10 929次阅读

    DeepSeek发布Janus Pro模型,英特尔Gaudi 2D AI加速器优化支持

    Gaudi 2D AI加速器现已针对该模型进行了全面优化。这一优化举措使得AI开发者能够更轻松地实现复杂任务的部署与优化,从而有效满足行业应
    的头像 发表于 02-08 14:35 914次阅读

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理的第四代服务实例,以打造弹性算力底座的
    的头像 发表于 12-23 14:05 1234次阅读