0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI时代企业需要怎样的数据存储

IBM中国 来源:IBM中国 2025-05-07 14:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:周立旸

IBM 大中华区科技事业部存储软件产品总监

随着 DeepSeek 等新一代开源大模型的发布,AI 变得越来越智能,使用更少的资源就能够创造更高的应用价值,越来越多的企业都正在由内而外、由浅入深地部署各种 AI 应用。从更大的视角看,市场的不确定性进一步加剧企业的“算力焦虑”,如何盘活现有计算资源、打通内部数据已经成为 CIO、CTO 们的当务之急。

在今年 1月的 CES 大会上,英伟达等科技公司认为 AI 发展至今,已经需要新的定律来描述不同的计算资源配置如何影响模型性能,包括预训练扩展、后训练扩展和测试时扩展 (也称为长思考)。在强化学习、模型调优以及运用 AI 推理模型阶段,企业能够用更小的算力增加来获得更智能、更强大的 AI。为了防范数据泄露风险,大多用户采用了本地化部署的 AI 基础设施来进行应用开发和调优,并通过思维链和多模型矩阵来优化 AI 推理效果。这些算力集群不仅需要对应的高性能分布式存储,更需要与之匹配的现代化数据访问和管理服务。

企业为什么需要 AI 存储?

当我们问 DeepSeek “AI 时代需要哪种存储”,它给出了如下答案:

具体到真实的企业应用场景,AI 存储解决方案需要应对如下挑战:

昂贵的 GPU 资源:许多用户投入了巨额资金来购买一体机和算力平台,需要存储方案缩短 AI 开发的时间、提升推理应用的效率,更快地获得所需的结果;

分散的 AI 数据:AI 需要实时、可信的数据才能发挥作用,企业端的应用更是需要结合企业自有的历史和实时数据。这需要企业有效地整合非结构化数据,在需要的时间和地点交付数据,为各种 AI 应用提供透明的数据访问;

不断增加的存储成本:伴随数据量的不断增大,企业需要消除数据孤岛,实现数据生命周期管理,用更低的成本实现更高性能的数据访问和更大容量的数据保留,通过智能化的数据分层降低总体开销;

确保数据安全合规:随着数据成为关键生产要素,企业需要更安全的手段和更严格的规定来抵御安全风险、自然灾害和人为错误,确保数据一直可用;同时实现网络安全弹性,在勒索攻击等事件发生后快速恢复数据,确保业务持续性。

AI 时代,企业需要怎样的数据存储?

以 DeepSeek 为代表的“小而美”开源模型,通过算法层面的优化实现了可观的“降本增效”。那么,基础架构层面的优化能否满足以上需求,带来更大收益呢?

答案是肯定的。得益于在高性能计算和并行计算领域的长期积累,IBM 的 AI 数据存储解决方案可以提供优化的数据基础架构,包括:

加速 AI 发现和 GPU 的数据访问:IBM Storage Scale 软件可以并行访问全局数据,帮助实现协议互通 (如容器、对象、文件、POSIX 等),支持 NVIDIA GPUDirect 提升 GPU 数据访问效率,通过“容器原生数据访问”为各种 AI 应用和微服务提供更高性能;

增强基于分布式/云数据的协同工作:IBM 的全局数据平台可以实现存储抽象和加速能力,将企业分布的数据整合为统一的数据资源,实现自动化的数据加速和透明的远程数据访问,全局访问位于磁带、云或现有存储资源上的数据来帮助消除数据孤岛;

绿色节能,降低成本:通过 IBM 软件定义存储强大的数据调度能力,结合高性能存储、对象存储(如 Ceph)和磁带存储实现基于策略的数据分层,可以为 AI 应用优化数据存储的性能和成本;

实现数据安全弹性:为 AI 治理提供集成的数据目录,为实现网络安全弹性提供快速恢复和 Safeguarded Copy(不可变副本),通过高效的数据保护机制可以提供高达6个 9 的可用性。

AI 存储的应用场景

以上技术的集合将为企业打造更高效、更安全的存储平台,以解锁数据价值,应对 AI 时代的数据挑战。典型场景包括:

AI 调优、推理与训练:其中,用于调优和推理的系统往往采用容器化部署,需要丰富的数据管理功能和接口,同时提供企业级的安全容灾能力支持业务连续性;用于训练的系统需要能支持大规模 GPU 集群运行所需的读写性能和扩展能力。采用高效的数据存储可以实现数据加速,提升应用效率。

96fa7a64-24e2-11f0-9310-92fbcf53809c.png

以 IBM watsonx.ai 平台为例,IBM 配备了 AI 一体机 IBM Fusion HCI,其后台采用 IBM 软件定义的高性能存储,可以满足不同规模大模型部署的需求,同时确保在几十乃至上百个用户并发访问的情况下,维持稳定的 token 输出速度来满足推理应用的服务水平。

在 AI 训练领域,全球许多千卡万卡的大集群都采用了 IBM 的 AI 存储,例如部署在德国尤里希超级计算中心的 JUPITER、部署在西班牙巴塞罗那超算中心的 MareNostrum 5、IBM 用于训练 Granite 模型的 Blue Vela 等等。基于英伟达 SuperPOD 的测试结果显示,采用同样数量的节点训练同样的模型,采用 IBM SSS 6000 高性能并行存储的 4个迭代训练时间,比基于全 NVMe 的 NAS 整整缩短一倍。对于一个投入几千万甚至是几亿的基础设施来讲,这意味着经济成本的巨大节约。

在国内,某智能驾驶应用的领军企业、某头部量化私募基金以及某高校的冷冻电镜项目都选择了 IBM Storage Scale System,在多云环境中打造统一的全局数据平台,同时快速响应数据调度需求,实现高效开发迭代和系统管理。

AI 数据湖仓

伴随 AI 应用的飞速发展,企业需要从快速增长的非结构化数据中提取洞察并用于推理,不断扩展检索增强生成(RAG)、AI 推理等应用场景。AI 数据湖仓可以在不影响信任和安全的前提下,提供更实时、更可信的数据访问。以汽车制造为例,车企客户可以通过车联网实时收集和整理车载传感器的数据,用于开发更智能的模型,并利用这些数据为用户提供更好的服务。

基于 IBM 全局数据平台强大的混合云支持能力和灵活的容器应用接口,以及对多应用多集群的多租户的支持能力,用户可以整合现有数据存储,为数据构建高效的 AI 数据管道。今年,IBM 还开发了新一代内容感知存储 (Content-aware Storage) 功能,以增强其检索增强生成 (RAG) 能力来帮助用户加速各种推理应用。

97859fc2-24e2-11f0-9310-92fbcf53809c.png

数据深度归档

随着 AI 应用的拓展,企业对数据的安全性、可靠性、合规性的要求也不断提高,需要采用更安全、更低成本的存储来大幅降低数据保留的成本。

979551e2-24e2-11f0-9310-92fbcf53809c.png

通过IBM 软件定义存储技术,IBM 磁带库可以提供 S3 接口,让企业可以使用对象存储或者公有云存储一样的方式实现数据归档。磁带的大容量、低成本等优势,可以大幅降低 PB 级别数据的长期保留成本。例如,采用 IBM Diamondback 的深度归档方案,27PB 数据的 10年保留成本比公有云存储降低近 90%。

写在最后

在 Gartner 发布的 2024年分布式文件和对象存储魔力象限中,IBM 第九次被评为领导者,大量金融、汽车、电子等行业的全球领先企业都采用了 IBM AI 存储解决方案。通过和全球 AI 技术领导者的合作,IBM 将持续创新,提供现代化、开放、安全的数据基础架构,助力客户在 AI 时代解锁更多商业价值。

关于 IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1853

    浏览量

    76786
  • AI
    AI
    +关注

    关注

    89

    文章

    38124

    浏览量

    296714
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4970
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2815

原文标题:IBM 专家观点:假如 DeepSeek 们使用了 IBM AI 存储

文章出处:【微信号:IBMGCG,微信公众号:IBM中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI NAS:当存储遇上智能,开启数据管理新纪元

    数据爆炸的时代AI NAS(网络附加存储)已成为个人和企业存储海量
    的头像 发表于 11-27 11:26 680次阅读
    <b class='flag-5'>AI</b> NAS:当<b class='flag-5'>存储</b>遇上智能,开启<b class='flag-5'>数据</b>管理新纪元

    AI时代,如何用服务器存储如何升级?

    相对于HBM、GDDR和DRAM,企业级SSD优势在于弥补了数据供给速度与计算速度之间的巨大鸿沟,特别是全新的CPU、GPU在算力、核心数量、AI吞吐量井喷式的增长,以往的低速存储很容
    的头像 发表于 11-03 14:46 1370次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>时代</b>,如何用服务器<b class='flag-5'>存储</b>如何升级?

    AI时代,服务器存储如何升级?

    和新应用挑战。无论是CXL与内存扩展技术的落地,还是PCIe 5.0和PCIe 6.0与AI数据密集型应用推动的本地高速存储,都将企业级固态硬盘推向了非常重要角色。
    的头像 发表于 11-03 13:11 322次阅读

    AI数据周期存储破局者:企业级SSD激活千亿级市场

    AI服务器加速部署,边缘和云端需求持续升级的前提下,闪存技术如何提升以应对数据激增的新AI时代?国际调研机构IDC带来了哪些前瞻的观点?全球知名的
    的头像 发表于 10-11 09:27 9809次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>数据</b>周期<b class='flag-5'>存储</b>破局者:<b class='flag-5'>企业</b>级SSD激活千亿级市场

    霄云科技银河存储:重构AI时代存储新范式

    在人工智能与高性能计算需求呈指数级增长的今天,数据存储的效率与可靠性已成为算力释放的关键支撑。上海霄云信息科技有限公司正式推出全新一代AI存储产品--霄云银河
    的头像 发表于 08-21 10:36 739次阅读
    霄云科技银河<b class='flag-5'>存储</b>:重构<b class='flag-5'>AI</b><b class='flag-5'>时代</b>的<b class='flag-5'>存储</b>新范式

    数智化时代数据存储“进化论”该如何书写?

    。Gartner预测,到2028年,企业软件应用中具备自主性AI的比例将从不到1%升至33%,30%的企业机构会把数据变现或入表纳入数据战略
    的头像 发表于 04-16 11:21 494次阅读
    数智化<b class='flag-5'>时代</b>,<b class='flag-5'>数据</b><b class='flag-5'>存储</b>“进化论”该如何书写?

    AI 时代开启,企业跟风做 AI 产品是明智之举?

    AI
    华成工控
    发布于 :2025年04月10日 17:28:44

    华为加速AI时代数据存储产业发展

    近日,在华为中国合作伙伴大会2025上,华为数据存储产品线总裁周跃峰发表“共筑数智解决方案,共享数据存储产业大发展”主题演讲,深入探讨如何加速AI
    的头像 发表于 04-01 15:35 903次阅读

    适用于数据中心和AI时代的800G网络

    ,成为新一代AI数据中心的核心驱动力。 AI时代的两大数据中心:AI工厂与
    发表于 03-25 17:35

    英伟达GTC2025亮点:NVIDIA认证计划扩展至企业存储领域,加速AI工厂部署

    全新的存储认证和参考架构让企业 IT 部门能更轻松地选择和部署 AI 基础设施,实现最优的性能和能效。 AI 部署的成功依靠速度、数据和规模
    的头像 发表于 03-21 19:38 1719次阅读

    英伟达GTC2025亮点:NVIDIA与行业领先存储企业共同推出面向AI时代的新型企业基础设施

    的参考设计,领先的存储提供商可用来构建全新的 AI 基础设施,以满足 AI 推理工作负载的严苛要求:即企业存储平台,搭载由 NVIDIA 加
    的头像 发表于 03-21 09:42 1066次阅读

    NVIDIA 与行业领先的存储企业共同推出面向 AI 时代的新型企业基础设施

    3 月 18 日 —— NVIDIA 今日推出了 NVIDIA AI 数据平台 —— 一项可自定义的参考设计,领先的存储提供商可用来构建全新的 AI 基础设施,以满足
    发表于 03-19 10:11 414次阅读
    NVIDIA 与行业领先的<b class='flag-5'>存储</b><b class='flag-5'>企业</b>共同推出面向 <b class='flag-5'>AI</b> <b class='flag-5'>时代</b>的新型<b class='flag-5'>企业</b>基础设施

    数字化时代存储变革:闪迪引领AI应用的数据支持

    在数字化时代数据已成为推动社会和经济发展的核心驱动力。随着人工智能(AI)、手机、自动驾驶的快速发展,数据存储技术的重要性愈发凸显。随着现
    的头像 发表于 03-19 08:59 638次阅读
    数字化<b class='flag-5'>时代</b>的<b class='flag-5'>存储</b>变革:闪迪引领<b class='flag-5'>AI</b>应用的<b class='flag-5'>数据</b>支持

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    AI时代,FPGA(现场可编程门阵列)具有极其重要的地位,主要体现在以下几个方面: 1.硬件加速与高效能 • 并行处理能力:FPGA内部由大量可编程逻辑单元组成,能够实现高度并行的数据处理。这种
    发表于 02-19 13:55

    AI赋能边缘网关:开启智能时代的新蓝海

    。这一变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和带宽压力。
    发表于 02-15 11:41