0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型算力新选择——宝德AI服务器采用8颗英特尔Gaudi®2加速器

科技讯息 来源:科技讯息 作者:科技讯息 2023-07-19 14:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,英特尔专门针对中国市场推出深度学习加速器Habana®Gaudi®2.以领先的性价比优势,加速AI训练及推理,提高深度学习性能和效率,从而成为大规模部署AI的更优解。作为英特尔在中国最重要的战略合作伙伴和中国AI服务器市场的TOP3.宝德计算积极携手英特尔,推出了支持8颗Gaudi®2加速器的AI加速计算服务器——PR8908WG,具有高性能、可扩展性强、高能效和开箱即用等优势,能够为AI客户尤其是大模型训练和推理提供超高性价比的算力支撑。

全新Gaudi®2训练加速器,专为深度学习而生

Gaudi®2采用7nm制程工艺,拥有高性能架构,具备24个可编程Tensor处理器核心(TPCs),21个100Gbps(RoCEv2)以太网接口,96GB HBM2E内存容量,2.4TB/秒的总内存带宽,48MB片上SRAM,并且集成多媒体处理引擎,为训练大语言模型提供高性能、高可扩展性和高能效的AI算力,在MLCommons®MLPerf@基准测试之GPT-3模型、计算机视觉模型ResNet-50、Unet3D、以及自然语言处理模型BERT等方面均取得了优异的成绩。

生成式AI和大语言模型需要服务器集群来满足大规模且更加复杂的计算要求。英特尔Gaudi®2处理器作为一款高性能、完全可编程的AI处理器,整合了多项技术创新,具有高内存带宽/容量和基于标准以太网技术的纵向扩展能力,并支持使用外接网卡通过PCle接口实现横向扩展,可满足多节点集群需要。同时,英特尔不断打造领先、成熟的软件生态支持,SynapseAI®软件套件就针对Gaudi平台深度学习业务进行了优化,它集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求。

宝德AI服务器PR8908WG+ Gaudi®2.大模型算力新选择

宝德AI服务器PR8908WG采用第三代英特尔®至强®可扩展处理器,8U空间支持8颗OAM高速互联的Gaudi®2 AI加速器,每颗Gaudi®2芯片配置96GB HBM高速内存,GPU与 GPU 之间互联带宽达到400GB/s,提供2.1Tbps的P2P互联带宽,支持全互联拓扑,全面满足大模型训练的海量通信需求;它支持200Gb ETH和HDR高速智能网卡,支持GPU Direct RDMA,完美满足集群和超大规模扩展应用。

PR8908WG拥有32个DDR4 DIMM插槽,最大支持8TB 32x 256 GB DRAM;支持24块2.5英寸SAS/SATA热插拔硬盘位,默认支持8块直连SATA硬盘,4块NVMe U.2 SSD,同时内置2个NVMe M.2 SSD,实现 CPU 直通设计,降低 I/O 延迟;它提供2个PCIe 4.0 x16 FHFL插槽和2 个PCIe 4.0 x8 FHFL插槽;支持以太网、InfiniBand、OPA等多种不同网络选择和互联需求。

PR8908WG整机采用模块化设计,独立的GPU和CPU 热量分区设计确保系统在最苛刻的工作负载下性能和稳定性不受影响;同时板载集成BMC、支持通过RAID卡超级电容、支持IPMI 2.0远程管理等,非常方便用户对AI算力设备的维护管理。

综上,宝德AI加速计算服务器PR8908WG可以满足AI不同场景下海量数据的计算和推理需求,特别适用于大模型训练和推理、深度学习、自动驾驶、智能城市、医疗健康、大数据、高性能计算(HPC)和虚拟现实等应用场景,帮助加速更多AI技术的落地和应用。

大模型将带来AI新价值,“百模大战时代”已经来临。随着各大模型的争奇斗艳和对成本、盈利模式等的日益关注,性价比为王将成为AI算力的新标准。作为中国领先的计算产品方案提供商,宝德计算将继续发挥AI服务器领域的技术优势和市场经验,携手英特尔等合作伙伴不断创新,探索大模型算力的更多选择,打造更具性价比的AI算力和解决方案,助力中国大模型更多细分场景的落地和商业变现,共同加速中国大模型技术的发展步伐,推动中国人工智能产业的整体升级!

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179268
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39711
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90870
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296416
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从云到端:英特尔展示全栈AI能力,覆盖云、边、PC多场景

    通用型实例u2i,内存增强型实例re8和第九代企业级ECS实例g9i,以及磐久AI高性能存储服务器
    的头像 发表于 09-26 17:27 1267次阅读
    从云到端:<b class='flag-5'>英特尔</b>展示全栈<b class='flag-5'>AI</b>能力,覆盖云、边、PC多场景

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔
    的头像 发表于 08-26 19:18 2572次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套系统的性能。
    的头像 发表于 06-27 11:44 597次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制与边缘智一体机,创造“AI新视界”

    处理的边缘 AI 控制 和 基于英特尔锐炫 ™ 显卡的边缘智一体机 ,为工业AI的规模化落
    发表于 06-24 17:50 1390次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制<b class='flag-5'>器</b>与边缘智<b class='flag-5'>算</b>一体机,创造“<b class='flag-5'>AI</b>新视界”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3 AI
    的头像 发表于 05-21 00:57 6954次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系
    的头像 发表于 05-20 12:27 5145次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI
    发表于 05-20 11:03 1664次阅读

    智能服务器应用领域

    加速金融模型训练与实时交易决策,头部机构云平台规模超3.8万台服务器‌。 二、‌医疗健康‌ 药物研发与基因测序‌:
    的头像 发表于 04-21 09:09 1212次阅读
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务器</b>应用领域

    RAKsmart服务器如何重塑AI高并发格局

    AI模型参数量突破万亿级、实时推理需求激增的当下,传统服务器架构的并发处理能力已逼近物理极限。RAKsmart通过“硬件重构+软件定义”的双引擎创新,推出新一代AI
    的头像 发表于 04-03 10:37 668次阅读

    英特尔酷睿Ultra AI PC上部署多种图像生成模型

    全新英特尔酷睿Ultra 200V系列处理对比上代Meteor Lake,升级了模块化结构、封装工艺,采用全新性能核与能效核、英特尔硬件线程调度
    的头像 发表于 04-02 15:47 1133次阅读
    在<b class='flag-5'>英特尔</b>酷睿Ultra <b class='flag-5'>AI</b> PC上部署多种图像生成<b class='flag-5'>模型</b>

    部署成本显著降低!英特尔助阵高效AI一体机方案

    3月27日,英特尔举办了名为“‘至’绘未来,锐炫来袭”的创新解决方案研讨会,与生态伙伴共同分享最新AI一体机方案。该方案基于英特尔®至强
    的头像 发表于 03-29 16:29 1712次阅读
    部署成本显著降低!<b class='flag-5'>英特尔</b>助阵高效<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>一体机方案

    如何在RAKsmart服务器上实现企业AI模型部署

    AI模型的训练与部署需要强大的支持、稳定的网络环境和专业的技术管理。RAKsmart作为全球领先的服务器托管与云计算
    的头像 发表于 03-27 09:46 758次阅读

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型进行了深度优化。 这一优化举措使得AI开发者能够以更低的成本和更高的效率实现复杂任务的部署与优化。英特尔Gaudi 2D
    的头像 发表于 02-10 11:10 925次阅读

    DeepSeek发布Janus Pro模型英特尔Gaudi 2D AI加速器优化支持

    Gaudi 2D AI加速器现已针对该模型进行了全面优化。这一优化举措使得AI开发者能够更轻松地
    的头像 发表于 02-08 14:35 908次阅读

    英特尔带您解锁云上智新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理的第四代服务器实例,以打造弹性
    的头像 发表于 12-23 14:05 1226次阅读