0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为深度学习而生,英特尔全新Gaudi2处理器正式登陆中国

科技讯息 来源:科技讯息 作者:科技讯息 2023-07-13 09:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi深度学习加速器——Habana®Gaudi®2。作为英特尔从云到端产品组合的重要组成,Gaudi2致力于以领先的性价比优势,加速AI训练及推理,为中国用户提供更高的深度学习性能和效率,从而成为大规模部署AI的更优解。

英特尔执行副总裁兼数据中心人工智能事业部总经理Sandra Rivera指出,“英特尔致力于通过为客户提供广泛的硬件选择,并支持开放的软件环境,加速人工智能技术的发展。凭借包括至强可扩展处理器和Gaudi2深度学习加速器在内的产品组合,英特尔正在降低人工智能的准入门槛,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力,从而帮助构建中国人工智能的未来。”

为深度学习而生的全新Gaudi2训练加速器

该Gaudi2深度学习加速器暨Gaudi2夹层卡HL-225B,以第一代Gaudi高性能架构为基础,以多方位性能与能效比提升,加速高性能大语言模型运行。该加速器具备:

·24个可编程Tensor处理器核心(TPCs)

·21个100Gbps(RoCEv2)以太网接口

·96GB HBM2E内存容量

·2.4TB/秒的总内存带宽

·48MB片上SRAM

·集成多媒体处理引擎

Gaudi2加速器的出色性能在6月公布的MLCommons® MLPerf®基准测试中得到了充分认证,其在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势,能够帮助用户提升运营效率的同时,降低运营成本。

此外,Gaudi2可为大规模的多模态和语言模型提供出色的推理性能。在最近的HuggingFace评估中,其在大规模推理方面的表现,包括在运行Stable Diffusion(另一个用于从文本生成图像的最先进生成式AI模型之一)、70亿以及1760亿参数BLOOMz模型时,在行业内保持领先。

满足大语言和多模态模型的需求

Gaudi2深度学习加速器的架构旨在高效扩展,以满足大规模语言模型及生成式AI模型的需求。其每张芯片集成了21个专用于内部互联的100Gbps(RoCEv2 RDMA)以太网接口,从而实现低延迟服务器内扩展。

在Stable Diffusion训练上,Gaudi2展示了从1张卡至64张卡近线性99%的扩展性。此外,MLCommons刚刚公布的MLPerf训练3.0结果,亦验证了Gaudi2处理器在1750亿参数的GPT-3模型上,从256个加速器到384个加速器可实现令人印象深刻的接近线性的95%扩展效果。

具备成熟的软件支持,Gaudi2产品在中国市场正式上市

伴随日益增长的生成式AI及大语言模型需求,英特尔亦致力于打造领先、成熟的软件支持,充分释放Gaudi2深度学习加速器性能。

为支持客户轻松构建模型,或将当前基于GPU的模型业务和系统迁移到基于全新Gaudi2服务器,并帮助保护软件开发投入,SynapseAI®软件套件针对Gaudi平台深度学习业务进行了优化,旨在与广泛的软件生态系统一起,帮助简化模型的开发和迁移。SynapseAI集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求。

目前,英特尔正与浪潮信息合作,打造并发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7。该服务器集成了8颗Gaudi2加速卡HL-225B,还包含双路第四代英特尔至强可扩展处理器。

携手中国产业生态,共启人工智能新篇

多年来,借助强大的AI软硬件基础,英特尔一直致力于为AI领域的各类工作负载提供业界领先的卓越性能,并通过开放的生态、丰富多样的产品选择不断降低AI部署的门槛,并为中国的AI发展提供坚定支持。

本次发布会上,美团、百度与浪潮信息等生态伙伴分别分享了其基于英特尔软硬件产品组合的多样化智能业务进展。百度智能云服务器高级经理何永占表示,集成英特尔®AMX加速引擎的第四代英特尔®至强®可扩展处理器为ERNIE-Tiny模型带来了多倍的性能优化,百度将持续构建领先的AI全栈能力和全面的开放生态,并期待与英特尔在未来的AI领域展开更为广泛、深入的合作。浪潮信息高级产品经理王磊强调,NF5698G7是专为面向生成式AI市场创新开发的新一代AI服务器,支持8颗OAM高速互联的Gaudi2加速器,具备高性能、高扩展、高能效和开放生态等优点,将为AI客户提供强大的大模型训练和推理能力。未来,浪潮信息将继续携手英特尔,为行业打造创新、领先的产品方案

此外,多家本土生态伙伴亦表明了与英特尔在当下及未来产品合作上的坚定立场与长远展望。新华三集团计算存储产品线副总裁刘宏程指出,新华三智慧计算秉持内生智能的技术理念,基于硬件使能、前瞻技术、绿色低碳等全方位能力,助力AI产业的高速发展。基于英特尔Gaudi2 AI加速器,新华三正与英特尔紧密合作,开发适合大模型训练和推理的高性能AI服务器,推动智能算力的普惠创新。与此同时,超聚变数字技术有限公司算力基础设施领域总裁唐启明表示,非常荣幸见证英特尔Gaudi2的发布。作为英特尔的长期战略合作伙伴,超聚变将一如既往地携手英特尔,共同推出基于Gaudi2的全新产品与解决方案,助力企业的AI场景成熟商用和规模落地。

未来,英特尔将持续引领产品技术发展,进一步加速大规模深度学习部署,助力中国本地AI市场发展。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54484

    浏览量

    469857
  • 英特尔
    +关注

    关注

    61

    文章

    10329

    浏览量

    181163
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40278
  • 深度学习
    +关注

    关注

    73

    文章

    5611

    浏览量

    124665
  • Gaudi2
    +关注

    关注

    0

    文章

    13

    浏览量

    296
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:英特尔
    的头像 发表于 04-26 16:27 1.1w次阅读
    AI工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    英特尔第三代酷睿处理器发布:18A 工艺普惠 AI,重塑日常计算体验

    近日,英特尔正式推出全新 **第三代英特尔 ® 酷睿™移动处理器** (Core Series 3),以**Intel 18A 先进制程**与**Panther Lake 架构**
    的头像 发表于 04-23 11:21 1791次阅读

    探秘ISL95813评估板:英特尔处理器打造的高性能电源解决方案

    探秘ISL95813评估板:英特尔处理器打造的高性能电源解决方案 作为电子工程师,我们常常在寻找能够为英特尔处理器提供高效、稳定电源的
    的头像 发表于 04-13 15:40 202次阅读

    高性能音频处理利器:ADSP - 21477/ADSP - 21478/ADSP - 21479处理器深度解析

    高性能音频处理利器:ADSP - 21477/ADSP - 21478/ADSP - 21479处理器深度解析 在当今的电子技术领域,高性能音频处理一直是一个备受关注的方向。而ADI公
    的头像 发表于 03-23 16:45 756次阅读

    英特尔至强6“芯”动GTC 2026,英伟达DCG Rubin解锁系统级性能

    在英伟达GTC 2026大会上,英特尔正式宣布,英特尔至强 6处理器将作为主控处理器,应用于NVIDIA DGX Rubin NVL8 系统。这一举措充分彰显了在AI工作负载快速迈向大
    的头像 发表于 03-19 16:43 436次阅读

    性能再越级!英特尔推出全新酷睿Ultra 200HX Plus系列移动处理器

    英特尔酷睿Ultra 200HX Plus系列登场,全新酷睿 Ultra 9 290HX Plus和酷睿Ultra 7 270HX Plus处理器极致性能需求注入更强动力。 今日,
    的头像 发表于 03-19 16:43 390次阅读

    释放极致游戏性能!英特尔酷睿Ultra 200S Plus发布

    布:今日,英特尔发布全新英特尔酷睿Ultra 200S Plus 系列台式机处理器——270K  Plus和 250K Plus,以全新特性
    的头像 发表于 03-19 13:13 453次阅读

    18核/24核双旗舰!英特尔酷睿Ultra 200S Plus发布,游戏性能大涨15%

    在桌面处理器领域,英特尔开启了新品发布。3月11日晚间,英特尔发布全新英特尔酷睿Ultra 200S plus系列,包含270K Plus和
    的头像 发表于 03-12 16:27 1.1w次阅读
    18核/24核双旗舰!<b class='flag-5'>英特尔</b>酷睿Ultra 200S Plus发布,游戏性能大涨15%

    18A工艺首发!英特尔推出下一代PC处理器,77%游戏性能暴涨+180TOPS算力

    1月6日,在CES 2026上,英特尔发布了代号为Panther Lake 的全新 Core Ultra 3 系列处理器上市产品阵容。该系列处理器基于18A 制程节点打造的AI PC计
    的头像 发表于 01-07 07:56 2.1w次阅读
    18A工艺首发!<b class='flag-5'>英特尔</b>推出下一代PC<b class='flag-5'>处理器</b>,77%游戏性能暴涨+180TOPS算力

    工业算力怎么选?ZMC6000系列I3/I5/I7处理器,精准匹配不同工业场景需求!

    工控机的“算力”是工业自动化的关键。致远电子ZMC6000系列工业PC,配备英特尔I3、I5、I7处理器,满足不同场景的算力需求。本文将介绍这三款处理器的性能,看它们如何为工业场景赋能。前言在工业
    的头像 发表于 09-18 11:38 1386次阅读
    工业算力怎么选?ZMC6000系列I3/I5/I7<b class='flag-5'>处理器</b>,精准匹配不同工业场景需求!

    英特尔Gaudi 2E AI加速DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,
    的头像 发表于 08-26 19:18 3369次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E AI加速<b class='flag-5'>器</b><b class='flag-5'>为</b>DeepSeek-V3.1提供加速支持

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理器,其中一款6776P被用作是DGX B300的主控CPU,这
    的头像 发表于 06-27 11:44 1063次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力AI系统高效运转

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速产品系列。包括全新
    的头像 发表于 05-21 00:57 7810次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和AI性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速产品系列。包括全新
    的头像 发表于 05-20 12:27 5718次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和AI性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    Computex 2025上,英特尔发布了专业人士和开发者设计的全新图形处理器(GPU)和AI加速产品系列。包括:
    发表于 05-20 11:03 1932次阅读