0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔全新Gaudi2处理器面世中国市场,加速大规模深度学习训练与推理

英特尔中国 来源:未知 2023-07-14 20:10 次阅读

7月11日,英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi深度学习加速器——HabanaGaudi2。作为英特尔从云到端产品组合的重要组成,Gaudi2致力于以领先的性价比优势,加速AI训练及推理,为中国用户提供更高的深度学习性能和效率,从而成为大规模部署AI的更优解。

aa62be34-223e-11ee-962d-dac502259ad0.jpg

英特尔于中国市场推出Gaudi2深度学习加速器

英特尔致力于通过为客户提供广泛的硬件选择,并支持开放的软件环境,加速人工智能技术的发展。凭借包括至强可扩展处理器和Gaudi2深度学习加速器在内的产品组合,英特尔正在降低人工智能的准入门槛,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力,从而帮助构建中国人工智能的未来。

-- Sandra Rivera

英特尔执行副总裁

兼数据中心与人工智能事业部总经理

为深度学习而生的

全新Gaudi2训练加速器

该Gaudi2深度学习加速器暨Gaudi2夹层卡HL-225B,以第一代Gaudi高性能架构为基础,以多方位性能与能效比提升,加速高性能大语言模型运行。该加速器具备:

●24个可编程Tensor处理器核心(TPCs)

● 21个100Gbps(RoCEv2)以太网接口

●96GB HBM2E内存容量

●2.4TB/秒的总内存带宽

●48MB片上SRAM

●集成多媒体处理引擎

aa8f67ea-223e-11ee-962d-dac502259ad0.png

Habana Gaudi2深度学习加速器

Gaudi2加速器的出色性能在6月公布的MLCommonsMLPerf基准测试1中得到了充分认证,其在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势,能够帮助用户提升运营效率的同时,降低运营成本。

此外,Gaudi2可为大规模的多模态和语言模型提供出色的推理性能。在最近的Hugging Face评估中,其在大规模推理方面的表现,包括在运行Stable Diffusion2(另一个用于从文本生成图像的最先进生成式AI模型之一)、70亿以及1760亿参数BLOOMz3模型时,在行业内保持领先。

满足大语言和多模态模型的需求

Gaudi2深度学习加速器的架构旨在高效扩展,以满足大规模语言模型及生成式AI模型的需求。其每张芯片集成了21个专用于内部互联的100Gbps(RoCEv2 RDMA)以太网接口,从而实现低延迟服务器内扩展。

在Stable Diffusion训练上,Gaudi2展示了从1张卡至64张卡近线性99%的扩展性。此外,MLCommons刚刚公布的MLPerf训练3.0结果4,亦验证了Gaudi2处理器在1750亿参数的GPT-3模型上,从256个加速器到384个加速器可实现令人印象深刻的接近线性的95%扩展效果。

具备成熟的软件支持,

Gaudi2产品在中国市场正式上市

伴随日益增长的生成式AI及大语言模型需求,英特尔亦致力于打造领先、成熟的软件支持,充分释放Gaudi2深度学习加速器性能。

为支持客户轻松构建模型,或将当前基于GPU的模型业务和系统迁移到基于全新Gaudi2服务器,并帮助保护软件开发投入,SynapseAI软件套件针对Gaudi平台深度学习业务进行了优化,旨在与广泛的软件生态系统一起,帮助简化模型的开发和迁移。SynapseAI集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求。

目前,英特尔正与浪潮信息合作,打造并发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7。该服务器集成了8颗Gaudi2加速卡HL-225B,还包含双路第四代英特尔至强可扩展处理器。

ab33a6a2-223e-11ee-962d-dac502259ad0.png

基于Gaudi2加速器的浪潮NF5698G7服务器

携手中国产业生态

共启人工智能新篇

多年来,借助强大的AI软硬件基础,英特尔一直致力于为AI领域的各类工作负载提供业界领先的卓越性能,并通过开放的生态、丰富多样的产品选择不断降低AI部署的门槛,并为中国的AI发展提供坚定支持。

本次发布会上,美团、百度与浪潮信息等生态伙伴分别分享了其基于英特尔软硬件产品组合的多样化智能业务进展。百度智能云服务器高级经理何永占表示,集成英特尔AMX加速引擎的第四代英特尔至强可扩展处理器为ERNIE-Tiny模型带来了多倍的性能优化,百度将持续构建领先的AI全栈能力和全面的开放生态,并期待与英特尔在未来的AI领域展开更为广泛、深入的合作。

浪潮信息高级产品经理王磊强调,NF5698G7是专为面向生成式AI市场创新开发的新一代AI服务器,支持8颗OAM高速互联的Gaudi2加速器,具备高性能、高扩展、高能效和开放生态等优点,将为AI客户提供强大的大模型训练和推理能力。未来,浪潮信息将继续携手英特尔,为行业打造创新、领先的产品方案

此外,多家本土生态伙伴亦表明了与英特尔在当下及未来产品合作上的坚定立场与长远展望。新华三集团计算存储产品线副总裁刘宏程指出,新华三智慧计算秉持内生智能的技术理念,基于硬件使能、前瞻技术、绿色低碳等全方位能力,助力AI产业的高速发展。基于英特尔Gaudi2 AI加速器,新华三正与英特尔紧密合作,开发适合大模型训练和推理的高性能AI服务器,推动智能算力的普惠创新。

与此同时,超聚变数字技术有限公司算力基础设施领域总裁唐启明表示,非常荣幸见证英特尔Gaudi2的发布。作为英特尔的长期战略合作伙伴,超聚变将一如既往地携手英特尔,共同推出基于Gaudi2的全新产品与解决方案,助力企业的AI场景成熟商用和规模落地。

未来,英特尔将持续引领产品技术发展,进一步加速大规模深度学习部署,助力中国本地AI市场发展。

注释:

1. https://mlcommons.org/en/training-normal-30/

2. https://huggingface.co/blog/habana-gaudi-2-benchmark

3.https://huggingface.co/blog/habana-gaudi-2-bloom

4. https://mlcommons.org/en/training-normal-30/


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9421

    浏览量

    168826
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10442

    浏览量

    206560
  • Gaudi2
    +关注

    关注

    0

    文章

    13

    浏览量

    57

原文标题:英特尔全新Gaudi2处理器面世中国市场,加速大规模深度学习训练与推理

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英特尔拟推出中国市场“特供版芯片”Gaudi 3

    英特尔计划在中国市场推出“特供版”Gaudi 3 AI芯片,这一决策主要是基于美国对于AI芯片的出口管制政策。
    的头像 发表于 04-16 14:48 198次阅读

    英特尔Gaudi2C处理器或为Gaudi2的简化版,Gaudi3预计2024年面世

    对于Gaudi2C和Gaudi2之间的差别,有推测认为它可能是“部分”改动后的产品,针对中国市场专门定制。Tomshardware则猜测可能是Gaudi2的简化版。
    的头像 发表于 12-20 13:44 605次阅读

    今日看点丨传英特尔将推Gaudi2降规版抢攻中国大陆市场;搭载自研电竞芯片,iQOO 12系列发布

    1. 美国升级AI 芯片禁令,传英特尔将推Gaudi2 降规版抢攻中国大陆市场   美国加强对华人工智能(AI)芯片管制,英特尔率先应变提出
    发表于 11-08 11:35 569次阅读
    今日看点丨传<b class='flag-5'>英特尔</b>将推<b class='flag-5'>Gaudi2</b>降规版抢攻<b class='flag-5'>中国</b>大陆<b class='flag-5'>市场</b>;搭载自研电竞芯片,iQOO 12系列发布

    有消息透露称,英特尔Gaudi 2处理器订单增多,Gaudi 3预计明年上市

    此前有消息称,今年 7月,英特尔面向中国市场推出了一款全新Gaudi2处理器,主要应用于加速
    的头像 发表于 09-20 10:50 672次阅读

    最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上推理性能惊人

    测试结果,其中包括英特尔所提交的基于Habana® Gaudi®2 加速器、第四代英特尔®至强®可扩展处理器,以及
    的头像 发表于 09-12 17:54 233次阅读
    最新MLPerf v3.1测试结果认证,<b class='flag-5'>Gaudi2</b>在GPT-J模型上<b class='flag-5'>推理</b>性能惊人

    Gaudi2夹层卡HL-225B数据表

    高迪第二代Al深度学习夹层卡HL-225B专为数据中心的大规模扩展而设计。训练处理器基于第一代高迪的高效架构,目前采用7nm工艺技术,在性能
    发表于 08-04 07:54

    HLS-GAUD12深度学习服务器数据资料

    lcelake CPu主机子系统,具有NVME存储和主机连接功能。 Gaudi2符合oCP OAM(开放式计算项目加速器模块)1.1规范。每块卡都包含Gaudi HL-2080处理器
    发表于 08-04 06:58

    Gaudi Training系统介绍

    用于高效渲染图形,而不是执行深度学习工作负载。深度学习工作负载的GPU效率低下严重影响了云平台和数据中心的运营成本。为了解决这个问题,哈瓦那实验室开发了从头开始设计的人工智能
    发表于 08-04 06:48

    Gaudi2架构和软件的全面解释

    Gaudi®2是哈瓦那的第二代深度学习加速器,支持训练推理
    发表于 08-04 06:15

    gpt-4怎么用 英特尔Gaudi2加速卡GPT-4详细参数

    介绍GPT-4 详细参数及英特尔发布 Gaudi2 加速器相关内容,对大模型及 GPU 生态进行探讨和展望。英特尔发布高性价比Gaudi2
    发表于 07-21 10:50 623次阅读
    gpt-4怎么用 <b class='flag-5'>英特尔</b><b class='flag-5'>Gaudi2</b><b class='flag-5'>加速</b>卡GPT-4详细参数

    大模型算力新选择——宝德AI服务器采用8颗英特尔Gaudi®2加速

    近日,英特尔专门针对中国市场推出深度学习加速器Habana® Gaudi®2.以领先的性价比优势
    的头像 发表于 07-19 14:43 494次阅读

    英特尔面向中国市场发布Gaudi2处理器加速大模型训练推理

    电子发烧友网报道(文/李弯弯)日前,英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi
    的头像 发表于 07-17 00:01 1282次阅读
    <b class='flag-5'>英特尔</b>面向<b class='flag-5'>中国市场</b>发布<b class='flag-5'>Gaudi2</b><b class='flag-5'>处理器</b>,<b class='flag-5'>加速</b>大模型<b class='flag-5'>训练</b>和<b class='flag-5'>推理</b>

    英特尔推出AI加速器性价比产品Gaudi2

    在两项测试中,Gaudi2均使用了英特尔推出的 SynapseAI1.10套件和OptimumHabana1.6;其中前者是面向Gaudi系列加速卡的SDK开发套件,能够对Tensor
    的头像 发表于 07-14 16:42 656次阅读
    <b class='flag-5'>英特尔</b>推出AI<b class='flag-5'>加速</b>器性价比产品<b class='flag-5'>Gaudi2</b>

    【机器视觉】欢创播报 | 英特尔发布Gaudi2争夺AI芯片市场

    英特尔也强调,Gaudi 2芯片是专为训练大语言模型而构建,采用7纳米制程,有24个张量处理器核心。事实上,去年英特尔就已经在海外发布了
    的头像 发表于 07-13 11:21 385次阅读

    深度学习而生,英特尔全新Gaudi2处理器正式登陆中国

    英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi深度
    的头像 发表于 07-13 09:48 544次阅读