0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型算力新选择——宝德AI服务器采用8颗英特尔Gaudi®2加速器

科技讯息 来源:科技讯息 作者:科技讯息 2023-07-19 14:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,英特尔专门针对中国市场推出深度学习加速器Habana®Gaudi®2.以领先的性价比优势,加速AI训练及推理,提高深度学习性能和效率,从而成为大规模部署AI的更优解。作为英特尔在中国最重要的战略合作伙伴和中国AI服务器市场的TOP3.宝德计算积极携手英特尔,推出了支持8颗Gaudi®2加速器的AI加速计算服务器——PR8908WG,具有高性能、可扩展性强、高能效和开箱即用等优势,能够为AI客户尤其是大模型训练和推理提供超高性价比的算力支撑。

全新Gaudi®2训练加速器,专为深度学习而生

Gaudi®2采用7nm制程工艺,拥有高性能架构,具备24个可编程Tensor处理器核心(TPCs),21个100Gbps(RoCEv2)以太网接口,96GB HBM2E内存容量,2.4TB/秒的总内存带宽,48MB片上SRAM,并且集成多媒体处理引擎,为训练大语言模型提供高性能、高可扩展性和高能效的AI算力,在MLCommons®MLPerf@基准测试之GPT-3模型、计算机视觉模型ResNet-50、Unet3D、以及自然语言处理模型BERT等方面均取得了优异的成绩。

生成式AI和大语言模型需要服务器集群来满足大规模且更加复杂的计算要求。英特尔Gaudi®2处理器作为一款高性能、完全可编程的AI处理器,整合了多项技术创新,具有高内存带宽/容量和基于标准以太网技术的纵向扩展能力,并支持使用外接网卡通过PCle接口实现横向扩展,可满足多节点集群需要。同时,英特尔不断打造领先、成熟的软件生态支持,SynapseAI®软件套件就针对Gaudi平台深度学习业务进行了优化,它集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求。

宝德AI服务器PR8908WG+ Gaudi®2.大模型算力新选择

宝德AI服务器PR8908WG采用第三代英特尔®至强®可扩展处理器,8U空间支持8颗OAM高速互联的Gaudi®2 AI加速器,每颗Gaudi®2芯片配置96GB HBM高速内存,GPU与 GPU 之间互联带宽达到400GB/s,提供2.1Tbps的P2P互联带宽,支持全互联拓扑,全面满足大模型训练的海量通信需求;它支持200Gb ETH和HDR高速智能网卡,支持GPU Direct RDMA,完美满足集群和超大规模扩展应用。

PR8908WG拥有32个DDR4 DIMM插槽,最大支持8TB 32x 256 GB DRAM;支持24块2.5英寸SAS/SATA热插拔硬盘位,默认支持8块直连SATA硬盘,4块NVMe U.2 SSD,同时内置2个NVMe M.2 SSD,实现 CPU 直通设计,降低 I/O 延迟;它提供2个PCIe 4.0 x16 FHFL插槽和2 个PCIe 4.0 x8 FHFL插槽;支持以太网、InfiniBand、OPA等多种不同网络选择和互联需求。

PR8908WG整机采用模块化设计,独立的GPU和CPU 热量分区设计确保系统在最苛刻的工作负载下性能和稳定性不受影响;同时板载集成BMC、支持通过RAID卡超级电容、支持IPMI 2.0远程管理等,非常方便用户对AI算力设备的维护管理。

综上,宝德AI加速计算服务器PR8908WG可以满足AI不同场景下海量数据的计算和推理需求,特别适用于大模型训练和推理、深度学习、自动驾驶、智能城市、医疗健康、大数据、高性能计算(HPC)和虚拟现实等应用场景,帮助加速更多AI技术的落地和应用。

大模型将带来AI新价值,“百模大战时代”已经来临。随着各大模型的争奇斗艳和对成本、盈利模式等的日益关注,性价比为王将成为AI算力的新标准。作为中国领先的计算产品方案提供商,宝德计算将继续发挥AI服务器领域的技术优势和市场经验,携手英特尔等合作伙伴不断创新,探索大模型算力的更多选择,打造更具性价比的AI算力和解决方案,助力中国大模型更多细分场景的落地和商业变现,共同加速中国大模型技术的发展步伐,推动中国人工智能产业的整体升级!

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10344

    浏览量

    181395
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40323
  • 服务器
    +关注

    关注

    14

    文章

    10467

    浏览量

    91895
  • AI
    AI
    +关注

    关注

    91

    文章

    42239

    浏览量

    303285
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科通技术与英特尔联合举办AI与产业创新生态研讨会深圳站

    近日,由科通技术与英特尔联合主办的“芯・新生态・深融合--AI与产业创新生态研讨会(深圳
    的头像 发表于 05-21 09:58 314次阅读

    AI服务器PCBA加工技术解析:高时代的核心制造能力

    AI服务器PCBA加工 是AI服务器硬件制造的重要环节,也是支撑人工智能基础设施的重要技术能
    的头像 发表于 04-16 22:57 278次阅读

    边缘AI临界点:深度解析176TOPS香橙派AI Station的产业价值

    AGX Orin 150 TOPS+ 本地大模型推理、具身智能控制、多模态实时交互 迷你AI服务器 176TOPS 意味着OrangePi AI Station正式迈入 高端边缘
    发表于 03-10 14:19

    高达 1570 TOPS!支持多硬盘的高服务器 CSB2-N10

    CSB2-N10服务器内置10个分布式计算节点,单节点可提供6-157TOPS,可选瑞芯微、能、NVIDIA等平台。支持主流
    的头像 发表于 01-06 16:33 907次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>高达 1570 TOPS!支持多硬盘的高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务器</b> CSB<b class='flag-5'>2</b>-N10

    高达 1100 TOPS!内置 Jetson AGX Orin 模组的高服务器

    CSB1-N4AGXOrin最高可配置4个NVIDIAJetsonAGXOrin(64GB)计算节点,最高1100TOPS(INT8)。支持主流AI
    的头像 发表于 12-17 16:31 926次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>高达 1100 TOPS!内置 Jetson AGX Orin 模组的高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务器</b>

    打造智基石:英特尔携手本土生态发布全域液冷服务器

    路冷板式全域液冷服务器。该创新方案由全本地生态赋能,实现了关键热源的高比例液冷覆盖,在提升可靠性与能效的同时,显著降低能耗与运维成本,为数据中心散热与能效树立全新标杆。 英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示:“
    的头像 发表于 11-20 14:31 660次阅读
    打造智<b class='flag-5'>算</b>基石:<b class='flag-5'>英特尔</b>携手本土生态发布全域液冷<b class='flag-5'>服务器</b>

    从云到端:英特尔展示全栈AI能力,覆盖云、边、PC多场景

    通用型实例u2i,内存增强型实例re8和第九代企业级ECS实例g9i,以及磐久AI高性能存储服务器
    的头像 发表于 09-26 17:27 1869次阅读
    从云到端:<b class='flag-5'>英特尔</b>展示全栈<b class='flag-5'>AI</b>能力,覆盖云、边、PC多场景

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔
    的头像 发表于 08-26 19:18 3500次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    多达 48 个计算节点!Firefly 推出 CSC2-N48 AI 服务器

    Firefly最新推出CSC2-N48服务器,内置48个分布式计算节点,单节点可提供6TOPS-157TOPS
    的头像 发表于 08-20 16:37 1985次阅读
    多达 48 个计算节点!Firefly 推出 CSC<b class='flag-5'>2</b>-N48 <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务器</b>

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    于OpenVINO™ 构建的 AI 软件平台的可扩展性,英特尔助力ISV生态伙伴率先实现应用端Day 0 模型适配,大幅加速了新模型的落地进
    的头像 发表于 08-07 14:42 1641次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大<b class='flag-5'>模型</b>

    能发布超节点服务器,128BM1690芯片组成

    电子发烧友网综合报道 在2025世界人工智能大会上,能最新发布了一款超节点服务器,可提供多达8T显存空间以及巨大的FP8
    的头像 发表于 08-03 07:33 8421次阅读
    <b class='flag-5'>算</b>能发布超节点<b class='flag-5'>服务器</b>,128<b class='flag-5'>颗</b>BM1690芯片组成

    科技上线赤兔推理引擎服务,创新解锁FP8模型

    模型轻量化部署方案。用户通过远程平台预置的模型镜像与AI工具,仅需50%的GPU
    的头像 发表于 07-30 21:44 1146次阅读

    看点:AMD服务器CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    给大家带来一些业界资讯: AMD服务器CPU市场份额追上英特尔 根据市场研究机构PassMark的统计分析数据显示,AMD 公司在服务器CPU 市场取得重大进展,市占率首次达到50%,与竞争对手
    的头像 发表于 07-25 14:41 1453次阅读
    看点:AMD<b class='flag-5'>服务器</b>CPU市场份额追上<b class='flag-5'>英特尔</b> 华为Mate80主动散热专利曝光

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套系统的性能。
    的头像 发表于 06-27 11:44 1136次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制与边缘智一体机,创造“AI新视界”

    处理的边缘 AI 控制 和 基于英特尔锐炫 ™ 显卡的边缘智一体机 ,为工业AI的规模化落
    发表于 06-24 17:50 1610次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制<b class='flag-5'>器</b>与边缘智<b class='flag-5'>算</b>一体机,创造“<b class='flag-5'>AI</b>新视界”