0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM发布了基于Power9的推理服务器IC922

倩倩 来源:百度粉丝网 2020-09-10 10:02 次阅读

IBM今天发布了基于Power9的推理服务器IC922,该服务器具有多达六个Nvidia T4 GPU,PCIe Gen 4和OpenCAPI连接,并且可以以2U尺寸容纳多达24个SFF驱动器。IBM说,与使用Nvidia V100 GPU的IBM AC922搭配使用,IBM表示,它现在为AI工作负载提供了一个完整的解决方案,包括数据管理,培训和推理。IBM还表示,新的IC922的价格为同等价格,或者比基于x86的同类产品更高。

T4 GPU 的使用 充分利用了Turing Tensor内核的多种混合精度功能(FP32,FP16,INT8,INT4),最适合推理和T4的较低成本。两者合计,这将有助于IBM攻击分析师认为是增长最快的AI市场细分市场,并且有可能成为销量最大的细分市场。相比之下,AC922利用Nvidia V100 GPU,它们更适合于传统的HPC和AI培训工作负载,并且成本更高。AC922采用与Summit超级计算机相同的体系结构进行建造,该超级计算机目前在世界500强排行榜(2019年11月)中名列世界上最快的超级计算机。

IBM提供管理,认知和横向扩展系统的总监Dylan Boday在与HPCwire进行了简要介绍后说:“ IC922专注于数据,推理和云 。” “我们将能够驱动多达24个小型驱动器,并在不久的将来包括24个NVMe驱动器。当您将24个NVMe驱动器和PCIe Gen 4组合到您的网络中时,从平衡的角度来看,您将拥有一个非常强大的故事。

“在机架级别,您可以获得非常高的吞吐量。对于AI而言,这很有趣,因为许多人开始关注存储部署及其层级层次结构。您需要对某些存储功能的“热”或低延迟访问。其次,最多可搭载六个T4 Nvidia GPU来启动它,从而为客户提供灵活性[并且]在不久的将来,我们将采用八个[T4],这将使您的GPU密度比HP或Dell高33%服务器将能够在2U服务器中运行。”

IBM还认为,它能够在总体上以及在容器性能方面利用其每核线程数的优势。

新系统将于2月7日上市。IBM报告称,它仍“正在研究将IC922扩展到IBM公共云中。” Linux Infrastructure首席产品经理Grace Liu今天在博客中 (通过推理完成您的AI难题)正式宣布了IC922 。

IBM一直承诺将重新推出AI产品,而IC922可能只是第一款产品。Boday说:“我们的Linux重点市场是为AI时代提供(一个)投资组合的市场。” 他认为,许多AI项目都失败了,原因之一是难以从受控的训练环境过渡到计算需求和技能不同的更加混乱的数据摄取和推断环境。他说,IC922已针对推理和数据管理进行了优化,并将使过渡更加容易。它的模块化设计使组织可以扩展基础架构,以满足内部或私有云环境中的需求。

当然,软件是另一个关键。在SC19上,IBM推广了其贝叶斯软件专业知识作为AI支持者。Boday在发布IC922的同时表示:“我们将推出一个推理软件,它基本上可以使您进行推理操作。” 简报中讨论的细节很少,在回答有关这些计划的电子邮件问题时,IBM回答说:“ IBM相信,就像训练需要专门的软件一样,AI推理也是如此。我们的Watson Machine Learning Accelerator产品系列将继续发展,以利用IBM Power Systems的AI最新功能,并且我们希望这种推理将继续下去。”

这听起来像是一个敬请期待的消息。下面显示的是官方公告的重点项目符号:

尽管IC922的重点是使用T4,但IBM指出了支持其他加速器类型的计划。

Boday说:“我不会讨论所有细节。” “随着Xilinx和其他ASIC功能向FPGAe的发展,已经有一些关于FPGA方向的陈述,如果这些设备希望开始利用FPGA作为推论,那么这就是一个面向未来的盒子。甚至是训练器材 市场上有数百种不同的加速功能迅速进入市场。该系统应该能够捕获它们。随着客户需求的增加,我们能够以敏捷的方法进行响应,将其添加到我们的服务器中,并为这些类型的加速功能提供同类最佳的解决方案。”

与提供用于CPU-GPU通讯的NVLink的AC922不同,LC922使用PCIe4。“在AC922中,我们具有NVLink –这是因为外形和Nvidia Volta内置的功能。这些类型的[培训系统]对整体吞吐量的需求较少,” Boday说。IBM选择利用IC922的PCIe密度优势,并为未来的设备提供OpenCAPI功能。在最近几个月中,围绕OpenCAPI 和 由英特尔牵头的最新CXL标准进行了大量讨论, 并 猜测如何在两者之间实现兼容性。

Boday说:“目前,CXL并非商业可行的技术。我要说的是CXL绝对在我们的雷达范围内。我们在CXL基金会中有一个董事会席位。因此,随着这种吸引力越来越大,我们将在那里产生重大影响力。我认为,几年前IBM与CAPI和OpenCAPI一起促进了加速发展。说到此框,它将具有OpenCAPI功能。实际上,这是第一个具有OpenCAPI功能的商用产品,我们将看到开发人员能够开始为所有新设备利用一致的,高吞吐量,低延迟的接口。”

IBM报告称它将很快有一个开发者委员会。“我们要做的第一件事就是使用基于Bittware FPGA的卡为市场提供 支持。它也将在不久的将来可用。这样一来,开发人员就可以利用低延迟/高吞吐量的优势,然后我们甚至将拥有一张卡,供他们在不久的将来也开始对此进行探索。”

IBM首席执行官Dave Turek在SC19提出的新产品如何适应更广泛的AI进入市场策略尚不清楚。他提出了一种战略,其中IBM将提供较小的AI系统,这些系统能够利用客户的现有基础架构来改善系统和应用程序性能。(有关更多信息,请参阅 HPCwire 文章 SC19:IBM更改其HPC-AI游戏计划)。

Liu在她的博客中写道:“为了展示IC922如何适合AI难题,美国国防部高性能计算现代化计划(HPCMP)最近展示了如何将IC922和AC922组合到模块化计算平台中,从而创建了IBM POWER9集装箱中的基于超级计算机的超级计算机。这种模块化计算功能最初安装在美国陆军作战能力发展司令部的陆军研究实验室DoD超级计算资源中心,它将使DoD重新定义“边缘”一词,以包括在世界任何地方(包括战场)部署AI超级计算能力。”

从某种意义上说,对边缘的使用可以涵盖类似于Turek所建议的部署,在该部署中,IBM引入了一个AI集群(最小到单个节点),以增强已经存在的基础架构的性能。他还暗示IBM将提供围绕特定功能(例如安全性和系统管理)专门化的AI系统。下一步可能是下一步,提供AC922-IC922组合以“增强”现有基础设施。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    51

    文章

    7308

    浏览量

    142941
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1671

    浏览量

    74272
  • 服务器
    +关注

    关注

    12

    文章

    8116

    浏览量

    82502
收藏 人收藏

    评论

    相关推荐

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 208次阅读

    服务器远程不上服务器怎么办?服务器无法远程的原因是什么?

    、安全软件问题 被安全软件屏蔽 解决办法:检查云锁和安全狗类安全软件有没有把电脑本地IP加入服务器白名单中,如果没有的话就把电脑本地IP加入白名 单就可以
    发表于 02-27 16:21

    linux服务器和windows服务器

    ,Linux服务器表现出更好的性能和稳定性,因此广泛应用于科学计算、大数据处理和网络服务器等领域。 另一方面,Windows服务器是由微软开发和维护的服务器操作系统,它提供
    发表于 02-22 15:46

    简单认识POWER系列架构处理器

    发布POWER2 架构处理器,并成为当时性能最高的处理器。1998年,IBM 发布了实现 64位POWER 指令集的
    的头像 发表于 11-28 09:21 954次阅读
    简单认识<b class='flag-5'>POWER</b>系列架构处理器

    串口服务器如何使用OneNET平台MQTT服务器通讯教程 #MQTT #串口服务器 #OneNET平台

    串口服务器
    亿佰特物联网应用专家
    发布于 :2023年10月26日 15:47:36

    服务器数据恢复-IBM服务器reiserfs文件系统数据恢复案例

    一台IBM X系列服务器,4块SAS硬盘组建一组RAID5阵列,采用的reiserfs文件系统。服务器操作系统分区结构:boot分区+LVM卷+swap分区(按照前后顺序)。LVM卷中直接划分了一个reiserfs文件系统,作为
    的头像 发表于 08-28 13:49 377次阅读

    ARM922T处理技术参考手册

    ARM922T处理是通用ARM9TDMI系列的一员微处理,包括:•ARM9TDMI(核心)•ARM940T(核心加4K和4K缓存和保护单
    发表于 08-02 15:44

    如何使用NVIDIA Triton 推理服务器来运行推理管道

    使用集成模型在 NVIDIA Triton 推理服务器上为 ML 模型管道提供服务
    的头像 发表于 07-05 16:30 1158次阅读
    如何使用NVIDIA Triton <b class='flag-5'>推理</b><b class='flag-5'>服务器</b>来运行<b class='flag-5'>推理</b>管道

    IBM服务器RAID5阵列数据恢复案例

    服务器数据恢复环境: IBM某型号服务器服务器中5块SAS磁盘组建了一组RAID5磁盘阵列。划分了一个LUN以及3个分区:第一个分区存放windows server系统,第二个分区
    的头像 发表于 07-05 16:03 403次阅读

    服务器数据恢复】IBM服务器5盘raid5数据恢复案例

    服务器数据恢复环境: 一台ibm某型号服务器,5块硬盘组建一组raid5磁盘阵列,redhat linux操作系统,上层部署有oracle数据库。 服务器故障: raid5阵
    的头像 发表于 07-03 17:16 478次阅读
    【<b class='flag-5'>服务器</b>数据恢复】<b class='flag-5'>IBM</b><b class='flag-5'>服务器</b>5盘raid5数据恢复案例

    什么是服务器指令?

    服务器
    YS YYDS
    发布于 :2023年06月23日 01:02:04

    AI服务器与传统服务器的区别是什么?

    AI 服务器确实是整个服务器市场的一部分,但它们是专门为基于云的 AI 模型训练或推理而设计的。在规格方面,广义的AI服务器是指搭载AI芯片(如前面提到的GPU、FPGA、ASIC)的
    发表于 06-21 12:40 1320次阅读

    通过Mosquitto发布到代理到服务器后如何断开MQTT?

    我正在处理 MQTT 代码 (tuanpmt),我想在数据通过 Mosquitto 发布到代理到服务器后断开 MQTT。 MQTT:发送,类型:3,id:0000 TCP: 已发送 MQTT:已
    发表于 06-12 07:44

    新一代K1 Power G3服务器隆重发布 构建关键计算基础设施

    浪潮信息"智算 开新局·创新机"全国巡展上海站开幕。会上,新一代K1 Power G3服务器产品重磅发布,新一代产品采用最新的Power10处理器,全面优化系统架构设计,最大整机性能相
    的头像 发表于 05-26 09:27 677次阅读

    用AT+CIPSERVER=1,80启动服务器时,可以启动UDP服务器吗?

    大家好, 我刚收到新的 esp 板,我发现有新固件,我无法使用 AT 命令 AT+GMR 启动 UDP 服务器,给我的是: 代码:全选AT version:0.21.0.0 SDK version
    发表于 05-15 07:27