0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM发布了基于Power9的推理服务器IC922

倩倩 来源:百度粉丝网 2020-09-10 10:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

IBM今天发布了基于Power9的推理服务器IC922,该服务器具有多达六个Nvidia T4 GPU,PCIe Gen 4和OpenCAPI连接,并且可以以2U尺寸容纳多达24个SFF驱动器。IBM说,与使用Nvidia V100 GPU的IBM AC922搭配使用,IBM表示,它现在为AI工作负载提供了一个完整的解决方案,包括数据管理,培训和推理。IBM还表示,新的IC922的价格为同等价格,或者比基于x86的同类产品更高。

T4 GPU 的使用 充分利用了Turing Tensor内核的多种混合精度功能(FP32,FP16,INT8,INT4),最适合推理和T4的较低成本。两者合计,这将有助于IBM攻击分析师认为是增长最快的AI市场细分市场,并且有可能成为销量最大的细分市场。相比之下,AC922利用Nvidia V100 GPU,它们更适合于传统的HPC和AI培训工作负载,并且成本更高。AC922采用与Summit超级计算机相同的体系结构进行建造,该超级计算机目前在世界500强排行榜(2019年11月)中名列世界上最快的超级计算机。

IBM提供管理,认知和横向扩展系统的总监Dylan Boday在与HPCwire进行了简要介绍后说:“ IC922专注于数据,推理和云 。” “我们将能够驱动多达24个小型驱动器,并在不久的将来包括24个NVMe驱动器。当您将24个NVMe驱动器和PCIe Gen 4组合到您的网络中时,从平衡的角度来看,您将拥有一个非常强大的故事。

“在机架级别,您可以获得非常高的吞吐量。对于AI而言,这很有趣,因为许多人开始关注存储部署及其层级层次结构。您需要对某些存储功能的“热”或低延迟访问。其次,最多可搭载六个T4 Nvidia GPU来启动它,从而为客户提供灵活性[并且]在不久的将来,我们将采用八个[T4],这将使您的GPU密度比HP或Dell高33%服务器将能够在2U服务器中运行。”

IBM还认为,它能够在总体上以及在容器性能方面利用其每核线程数的优势。

新系统将于2月7日上市。IBM报告称,它仍“正在研究将IC922扩展到IBM公共云中。” Linux Infrastructure首席产品经理Grace Liu今天在博客中 (通过推理完成您的AI难题)正式宣布了IC922 。

IBM一直承诺将重新推出AI产品,而IC922可能只是第一款产品。Boday说:“我们的Linux重点市场是为AI时代提供(一个)投资组合的市场。” 他认为,许多AI项目都失败了,原因之一是难以从受控的训练环境过渡到计算需求和技能不同的更加混乱的数据摄取和推断环境。他说,IC922已针对推理和数据管理进行了优化,并将使过渡更加容易。它的模块化设计使组织可以扩展基础架构,以满足内部或私有云环境中的需求。

当然,软件是另一个关键。在SC19上,IBM推广了其贝叶斯软件专业知识作为AI支持者。Boday在发布IC922的同时表示:“我们将推出一个推理软件,它基本上可以使您进行推理操作。” 简报中讨论的细节很少,在回答有关这些计划的电子邮件问题时,IBM回答说:“ IBM相信,就像训练需要专门的软件一样,AI推理也是如此。我们的Watson Machine Learning Accelerator产品系列将继续发展,以利用IBM Power Systems的AI最新功能,并且我们希望这种推理将继续下去。”

这听起来像是一个敬请期待的消息。下面显示的是官方公告的重点项目符号:

尽管IC922的重点是使用T4,但IBM指出了支持其他加速器类型的计划。

Boday说:“我不会讨论所有细节。” “随着Xilinx和其他ASIC功能向FPGAe的发展,已经有一些关于FPGA方向的陈述,如果这些设备希望开始利用FPGA作为推论,那么这就是一个面向未来的盒子。甚至是训练器材 市场上有数百种不同的加速功能迅速进入市场。该系统应该能够捕获它们。随着客户需求的增加,我们能够以敏捷的方法进行响应,将其添加到我们的服务器中,并为这些类型的加速功能提供同类最佳的解决方案。”

与提供用于CPU-GPU通讯的NVLink的AC922不同,LC922使用PCIe4。“在AC922中,我们具有NVLink –这是因为外形和Nvidia Volta内置的功能。这些类型的[培训系统]对整体吞吐量的需求较少,” Boday说。IBM选择利用IC922的PCIe密度优势,并为未来的设备提供OpenCAPI功能。在最近几个月中,围绕OpenCAPI 和 由英特尔牵头的最新CXL标准进行了大量讨论, 并 猜测如何在两者之间实现兼容性。

Boday说:“目前,CXL并非商业可行的技术。我要说的是CXL绝对在我们的雷达范围内。我们在CXL基金会中有一个董事会席位。因此,随着这种吸引力越来越大,我们将在那里产生重大影响力。我认为,几年前IBM与CAPI和OpenCAPI一起促进了加速发展。说到此框,它将具有OpenCAPI功能。实际上,这是第一个具有OpenCAPI功能的商用产品,我们将看到开发人员能够开始为所有新设备利用一致的,高吞吐量,低延迟的接口。”

IBM报告称它将很快有一个开发者委员会。“我们要做的第一件事就是使用基于Bittware FPGA的卡为市场提供 支持。它也将在不久的将来可用。这样一来,开发人员就可以利用低延迟/高吞吐量的优势,然后我们甚至将拥有一张卡,供他们在不久的将来也开始对此进行探索。”

IBM首席执行官Dave Turek在SC19提出的新产品如何适应更广泛的AI进入市场策略尚不清楚。他提出了一种战略,其中IBM将提供较小的AI系统,这些系统能够利用客户的现有基础架构来改善系统和应用程序性能。(有关更多信息,请参阅 HPCwire 文章 SC19:IBM更改其HPC-AI游戏计划)。

Liu在她的博客中写道:“为了展示IC922如何适合AI难题,美国国防部高性能计算现代化计划(HPCMP)最近展示了如何将IC922和AC922组合到模块化计算平台中,从而创建了IBM POWER9集装箱中的基于超级计算机的超级计算机。这种模块化计算功能最初安装在美国陆军作战能力发展司令部的陆军研究实验室DoD超级计算资源中心,它将使DoD重新定义“边缘”一词,以包括在世界任何地方(包括战场)部署AI超级计算能力。”

从某种意义上说,对边缘的使用可以涵盖类似于Turek所建议的部署,在该部署中,IBM引入了一个AI集群(最小到单个节点),以增强已经存在的基础架构的性能。他还暗示IBM将提供围绕特定功能(例如安全性和系统管理)专门化的AI系统。下一步可能是下一步,提供AC922-IC922组合以“增强”现有基础设施。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    54

    文章

    9012

    浏览量

    153325
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1853

    浏览量

    76778
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90874
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ai服务器是什么?与普通服务器有什么区别

    AI服务器并非简单的硬件堆砌,而是专门为人工智能任务设计的高性能计算系统。其核心目标是高效处理海量数据并行计算(如矩阵乘法、模型推理),并针对AI工作负载(如深度学习训练、大模型推理)进行全方位优化。
    的头像 发表于 06-24 16:39 2926次阅读

    欧洲服务器免费ip地址怎么获取?#欧洲服务器 #免费IP地址 #服务器

    服务器
    jf_57681485
    发布于 :2025年06月13日 11:15:04

    DNS服务器无法访问?2分钟快速排查与解决!#DNS服务器 #DNS #服务器

    服务器
    jf_57681485
    发布于 :2025年06月10日 14:55:34

    基于RAKsmart云服务器的AI大模型实时推理方案设计

    面对高并发请求、严格的响应延迟要求及波动的业务负载,传统本地化部署的算力瓶颈愈发显著。RAKsmart云服务器凭借其弹性计算资源池、分布式网络架构与全栈AI加速能力,为AI大模型实时推理提供从硬件到软件层的系统性解决方案。
    的头像 发表于 05-13 10:33 464次阅读

    国外bgp服务器多少钱?# 服务器

    服务器
    jf_57681485
    发布于 :2025年04月24日 14:19:00

    新加坡服务器延迟大吗?真相在这里#新加坡服务器 #服务器

    服务器
    jf_57681485
    发布于 :2025年04月18日 13:48:50

    AI 推理服务器都有什么?2025年服务器品牌排行TOP10与选购技巧

    根据行业数据,AI推理服务器的性能差异可以达到10倍以上。比如,用普通服务器跑一个700亿参数的大模型,可能需要30秒才能出结果,而用顶级服务器可能只需要3秒。这就是为什么选对
    的头像 发表于 04-09 11:06 7348次阅读
    AI <b class='flag-5'>推理</b><b class='flag-5'>服务器</b>都有什么?2025年<b class='flag-5'>服务器</b>品牌排行TOP10与选购技巧

    推理服务器的7大可靠性指标,宽温/抗震/EMC防护实测数据分享

    在 AIoT 设备突破百亿级的今天,边缘计算推理服务器已成为智能时代的 "神经末梢"。根据 Gartner 预测,到 2025 年将有 75% 的企业关键任务部署在边缘端。然而,工业级应用场景(如智能工厂、无人矿山、车路协同)对推理
    的头像 发表于 04-02 10:43 821次阅读
    <b class='flag-5'>推理</b><b class='flag-5'>服务器</b>的7大可靠性指标,宽温/抗震/EMC防护实测数据分享

    国产推理服务器如何选择?深度解析选型指南与华颉科技实战案例

    人工智能技术的爆发催生了对推理算力的迫切需求,而进口服务器的高成本与技术依赖性,推动了国产推理服务器的快速发展。据IDC预测,到2025年,中国AI
    的头像 发表于 03-24 17:11 937次阅读
    国产<b class='flag-5'>推理</b><b class='flag-5'>服务器</b>如何选择?深度解析选型指南与华颉科技实战案例

    NTP校时服务器 时钟同步服务器

    服务器
    jf_75250307
    发布于 :2025年03月19日 20:56:34

    服务器数据恢复—如何预防服务器故障与恢复服务器数据!

    服务器常见故障: 硬件故障:磁盘损坏、电池故障等。 软件问题:操作系统崩溃、未知的程序运行错误等。 病毒破坏:勒索病毒加密、删除服务器数据等。 不可控力量;服务器浸水、火烧、机房倒塌等导致
    的头像 发表于 03-11 12:36 814次阅读

    浪潮信息发布元脑R1推理服务器

    近日,浪潮信息正式推出了其创新的元脑R1推理服务器。这款服务器通过系统的创新与软硬件的协同优化,实现对DeepSeek R1 671B模型的单机部署与运行,为客户在智能应用部署方面带
    的头像 发表于 02-17 10:32 1036次阅读

    双北斗校时服务器、双北斗授时服务器、双北斗对时服务器、双北斗NTP服务器

    双北斗时间服务器具有许多优势,使其成为时间同步领域的佼佼者。首先,北斗卫星导航系统具有高精度、高稳定性和高实时性的特点,为北斗时间服务器提供可靠的时间源。其次,北斗时间服务器采用了先
    的头像 发表于 01-21 09:24 792次阅读
    双北斗校时<b class='flag-5'>服务器</b>、双北斗授时<b class='flag-5'>服务器</b>、双北斗对时<b class='flag-5'>服务器</b>、双北斗NTP<b class='flag-5'>服务器</b>