0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

破解AI带来的数据存储挑战,西部数据是如何做的?

焦点讯 来源:焦点讯 作者:焦点讯 2024-02-01 09:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在数智化时代,“数据”算得上是绝对的“C位”......

作为一种重要的生产要素,数据在规模化激增的同时,其价值也正在得到释放:新近印发的《“数据要素×”三年行动计划(2024—2026年)》提出,到2026年底,数据要素应用广度和深度大幅拓展,在经济发展领域数据要素乘数效应得到显现;以ChatGPT为代表的大模型持续火热,在带动算力,尤其是智能算力需求爆发的同时,也带来了用于大模型训练与大模型推理的海量大数据的需求。

这也仅仅是数据价值得到释放的案例之一。而随着AI大模型的进一步发展和普及,数据的规模将持续扩大,数据的价值还将得到进一步释放。在人工智能领域,西部数据认为,数据的质量与数量决定了人工智能的整体水平。然而,笔者注意到,大模型训练、推理所需的算力基础设施除了提供算力、运力等资源外,还需要提供存力,也就是数据存储力,这对数据存储的性能、容量、成本以及能耗提出新的要求。

“木桶效应”里,数据存力不做“短板”

算力、数据、算法是支撑AI大模型落地的三大要素,在大模型爆发初期,企业普遍将注意力放在价格高昂、供不应求的智能算力上,容易被忽略的数据存力同样起着至关重要的作用。事实上,大模型的训练与推理需要依托计算芯片、存储与网络共同构成的大规模算力集群,这其中,算力、存力、运力都不应该成为“木桶效应”的“短板”。

事实上,算力集群也是存在短板效应的,假如存储和网络无法支撑大规模数据存储、读写与传输,即使计算芯片的性能再强,也不会有用武之地,同时还会影响大模型训练的效率。之所以这样说是有原因的,相关调查显示,大模型场景对于数据存力有着高吞吐、高IOPS、高带宽、低延时的极致性能需求。如若存储性能达不到要求,会使得数据存力成为“短板”。

西部数据进一步指出,目前AI应用场景的存储架构主要建立在分层存储、存算分离的基础上,整套数据存储架构必须同时满足容量、性能、成本以及能耗的多样化要求,搭配多样化的产品组建数据存储基础设施。下面,笔者也将从大模型训练的数据所拥有的特征来验证西部数据的这一观点。

我们需要承认的事实是,大模型训练所需的数据规模是庞大的:以文档、图片、音视频为代表的非结构化数据,其规模可以达到几亿至几十亿量级;从纯文本的TB级到多种数据类型的PB级都需要占据大量的存储空间。

因此,海量数据需要存储系统支持高吞吐、大容量,同时支持多种协议数据互通,让数据能够快速地在各个环节流转,避免数据等待产生算力闲置的状况。

大模型训练对存储带宽也是有要求的,据悉,大模型训练存储带宽的要求比电商业务顶峰时段高出几百甚至几千倍,存储性能的高低可能造成模型训练周期数倍的差异。此外,大模型落地的成本也是关注的焦点,千亿级别参数、动辄以月来计算的训练周期,意味着极大的存储成本,降低成本成为关键所在。

破解存力短板,西部数据有哪些解决方案?

满足AI时代数据存储的需求,存储解决方案提供商需要从容量、性能、成本、能耗等方面出发,打造多样化、差异化的解决方案。西部数据以企业部署AIGC应用工作负载为例,对其所需的存储解决方案进行说明。西部数据认为,未来,以AIGC为代表的先进数字化应用产生的以存为主、低频使用且价值不太明显的非结构化数据的价值挖掘也将成为企业中的关键性问题。

西部数据预计,高效可靠地进行海量非结构化数据的存储和分析,将成为企业数据治理的一个重要考量。面对AI大模型的进一步发展和普及,西部数据将继续凭借在存储领域的多年积累和核心优势,提供多样化的数据存储解决方案和产品,为AI大模型进一步发展提供数据存储基础架构的坚实底座。具体来看,西部数据所提供的低时延、更高IOPS的SSD产品和大容量满足更低TCO和功耗的HDD产品能够为相关基础设施建设提供存储解决方案支持。

在Flash领域,西部数据打造的企业级SSD拥有三大核心技术优势,也就是集成完全自主的NAND Flash、先进的SSD控制器和高性能固件于一体,这样集成能够让SSD实现性能和稳定性的极致优化,确保SSD生命周期稳定的I/O一致性。同时,西部数据携手铠侠成功地推出第八代218层3D闪存,在性能、密度和成本效益方面实现了重大飞跃。西部数据还提供包括SN840、SN650、SN655在内的针对不同需求的企业级SSD产品,从而满足丰富多样的应用需求。

而在HDD领域,西部数据借助创新的OptiNAND技术、能量辅助磁记录(ePMR)、三阶寻轨定位系统(TSA)、氦气封装(HelioSeal)以及全新的UltraSMR技术,能够更好地帮助云服务客户降低存储总体拥有成本(TCO),从而持续、快速地扩展业务。同时,由于在面密度技术上的独特优势,西部数据能够更好地帮助客户获得更低的每TB容量功耗,帮助数据中心客户提高PUE(电源使用效率)。

HDD产品上,西部数据可提供容量高达24TB 的Ultrastar DC HC580 CMR HDD、及28TB 的Ultrastar DC HC680 SMR HDD。据了解,UltrastarDC HC680 SMR HDD为超大规模云、云服务提供商和企业级客户提供了更高的存储密度,广泛应用于大容量存储、在线备份、智慧视频、在线归档、云存储、合规性存储、大数据存储以及其他可能不常访问数据的应用。

西部数据透露,自2023年8月出样以来,28TB SMR HDD正在快速进入市场,它将进一步增强西部数据在SMR HDD市场的地位与发展势头。在公司2024财年第1季度,西部数据26TB SMR HDD总出货量将达到其数据中心产品总出货量的近50%。

携手合作伙伴,打造AI时代的存储方案

数据存储离不开合作伙伴,西部数据一直以来积极与合作伙伴在产品、技术和市场方面持续合作。在产品上,西部数据积极地与重要的软件开发商、云服务提供商都在做进一步方案系统升级的优化合作,并将最新的技术和产品交付样品给合作伙伴做联合测试,持续优化可能存在的问题,最终打造出符合合作伙伴和市场需要的解决方案。

比如,越来越多的客户将SMR添加到其数据中心发展路线之中,通过优化堆栈以发挥SMR技术的优势。因此,这些客户还可以通过采用目前市场上更大容量的HDD产品,以更低的功耗扩展产品组合部署,从而在上市速度方面持续保持优势。

据悉,西部数据UltrastarDC HC680已由部分超大规模云、云服务提供商和OEM客户进行验证,西部数据也希望以较低的每TB功耗,想要获得更大存储容量的大型企业级客户供货,用以构建更高效的存储系统和数据中心。

此外,西部数据还在上海浦东打造了西部数据解决方案赋能中心,以此来支持企业级、OEM客户进行产品与解决方案的测试,进一步支持本土市场。

除了合作伙伴,用户的反馈也是至关重要的。在西部数据看来,存储技术的发展离不开每一位应用和创造出数据的用户。为此,西部数据将持续聆听市场的声音和用户的反馈,不懈地创新、共同地开发满足未来存储需求的产品和解决方案。

面向未来,西部数据透露,也将积极地与行业内的头部云服务商、OEM以及其他合作伙伴保持紧密的合作关系,通过帮助部署西部数据创新的企业级存储产品,打造符合当前AI技术快速增长、多元AI应用不断涌现时代下的存储解决方案,进一步赋能新型计算与绿色算力的发展。

写在最后

如今的AI赛道可谓异常火热,这种火热不仅是端侧的大模型数量与规模的持续扩大,也不仅是大模型的训练与推理带来的智能算力的需求,同时还是AI持续赋能云、网、边、端的持续升级。而在这场关于AI赋能的竞赛中,我们不可否认的是,AI在带来新的机遇的同时也带来挑战,这包括算力、大模型质量、安全,这也包括数据存储。

换言之,随着AI的迅猛发展,数据存储需求的持续增加正在成为一个不可忽略的事实。据统计,AI服务器所需的DRAM和NAND闪存容量分别是常规服务器的8倍和3倍。这也意味着存储系统必须具备足够的容量来存储海量的训练数据和模型参数,以支持人工智能应用的高性能运行。

在这个背景下,我们看到以西部数据为代表的存储解决方案厂商充分整合积累的专业技术能力与各行业的合作经验,通过技术创新、解决方案的持续打造、与合作伙伴持续深入地合作和赋能,持续提供针对AI应用领域存储需求的定制化解决方案,为AI时代贡献着自己的力量。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4892

    浏览量

    90290
  • 数据存储
    +关注

    关注

    5

    文章

    1037

    浏览量

    53013
  • 西部数据
    +关注

    关注

    5

    文章

    544

    浏览量

    48339
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    意法半导体为超大规模AI数据中心破解供电难题

    AI大模型算力需求呈指数级飙升,兆瓦级AI机柜成为主流,传统54V低压配电系统早已触到物理极限,供电端的多重挑战正成为AI数据中心规模化发展
    的头像 发表于 04-07 15:46 281次阅读
    意法半导体为超大规模<b class='flag-5'>AI</b><b class='flag-5'>数据</b>中心<b class='flag-5'>破解</b>供电难题

    中科曙光数据存储赋能AI新基建

    当前,AI产业的竞争焦点正从单纯的算力竞赛,加速转向数据、算法与算力的综合角力。面对存储部件价格持续上涨带来的成本压力,以及大模型训练、智能体应用对
    的头像 发表于 03-12 09:44 356次阅读

    AI技术发展驱动数据存储体系变革

    存储与传输能力作为支撑。当生成式AI爆发式增长,边缘AI快速普及,数据存储的容量、速度、能效与定制化需求迎来颠覆性变革。
    的头像 发表于 02-11 15:09 1676次阅读
    <b class='flag-5'>AI</b>技术发展驱动<b class='flag-5'>数据</b><b class='flag-5'>存储</b>体系变革

    西部数据WD最新HDD技术路线曝光!40TB容量新高,100TB HDD指日可待

    近日,Western Digital更名为 WD,并推出新的品牌标识。该设计在视觉上参考了数据中心元素,体现公司转型为 AI 驱动型数据经济的核心存储基础设施提供商。
    的头像 发表于 02-06 10:51 2808次阅读
    <b class='flag-5'>西部数据</b>WD最新HDD技术路线曝光!40TB容量新高,100TB HDD指日可待

    西部数据加速 AI 时代存储创新

    Western Digital现更名为 WD,并发布 100TB+ HDD 路线图、性能与功耗优化的硬盘技术突破,以及重新定义存储经济效益和客户价值实现速度的智能平台解决方案   核心亮点
    的头像 发表于 02-04 15:11 308次阅读
    <b class='flag-5'>西部数据</b>加速 <b class='flag-5'>AI</b> 时代<b class='flag-5'>存储</b>创新

    SD NAND:工业 AI 巡检的存储硬核

    、红外热成像检测设备异常、振动传感器捕捉机械故障,实现 “全天候、无死角、高精度” 巡检。但极端环境(高温、粉尘、振动)、实时数据处理、长期稳定运行等需求,给存储系统带来严峻挑战:如何在狭小空间内
    的头像 发表于 12-26 09:42 373次阅读
    SD NAND:工业 <b class='flag-5'>AI</b> 巡检的<b class='flag-5'>存储</b>硬核

    西部数据2026年展望:AI时代构建面向未来的存储

    2025 年半导体市场在AI需求爆发与全产业链复苏的双重推动下,呈现出强劲的增长态势。以EDA/IP先进方法学、先进工艺、算力芯片、端侧AI、精准控制、高端模拟、高速互联、新型存储、先进封装等为代表
    的头像 发表于 12-23 09:30 5047次阅读
    <b class='flag-5'>西部数据</b>2026年展望:<b class='flag-5'>AI</b>时代构建面向未来的<b class='flag-5'>存储</b>

    AI HOME智能体:当存储遇上智能体,开启数据管理新纪元​

    AI HOME智能体的出现,标志着数据管理进入智能化时代。它将NAS的存储能力与AI的智能分析能力完美结合,为用户提供更高效、便捷、智能的数据
    的头像 发表于 12-17 17:02 1370次阅读
    <b class='flag-5'>AI</b> HOME智能体:当<b class='flag-5'>存储</b>遇上智能体,开启<b class='flag-5'>数据</b>管理新纪元​

    AI NAS:当存储遇上智能,开启数据管理新纪元

    数据爆炸的时代,AI NAS(网络附加存储)已成为个人和企业存储海量数据的利器。然而,面对日益庞大的
    的头像 发表于 11-27 11:26 1274次阅读
    <b class='flag-5'>AI</b> NAS:当<b class='flag-5'>存储</b>遇上智能,开启<b class='flag-5'>数据</b>管理新纪元

    西部数据扩建系统集成测试实验室,以加速客户在持续增长的 AI 和云时代取得成功

    西部数据(NASDAQ: WDC)近日宣布正式启用其扩建的系统集成测试 (SIT)实验室。这座先进的设施占地 25,600 平方英尺,旨在加速客户成功并加快价值落地。随着 AI 应用驱动存储需求的大幅增长,新实验室将聚焦满足客
    的头像 发表于 10-22 16:05 1593次阅读
    <b class='flag-5'>西部数据</b>扩建系统集成测试实验室,以加速客户在持续增长的 <b class='flag-5'>AI</b> 和云时代取得成功

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI的发展历程吗?本章作者将为我们打开AI的发展历程以及需求和挑战的面纱。 从2017年开始生成式AI
    发表于 09-12 16:07

    西部数据通过 MLPerfâ Storage V2 测试结果,验证其真实场景下的AI存储性能

    西部数据 OpenFlex™ Data24 4000 系列 NVMe-oFä 存储平台,基于铠侠 CM7-V 系列 NVMe® 固态硬盘与配置 PEAK:AIO 软件的AI智算服务器,展现出卓越
    发表于 08-05 18:15 1069次阅读

    澳鹏发布MediGo医疗大模型数据开发平台 破解医疗AI数据瓶颈

    不足、多模态协同处理效率低下等核心挑战。该平台的推出标志着医疗AI数据服务进入专业化、智能化新阶段,将为医疗AI的临床应用提供强有力的数据
    的头像 发表于 06-24 07:26 466次阅读
    澳鹏发布MediGo医疗大模型<b class='flag-5'>数据</b>开发平台 <b class='flag-5'>破解</b>医疗<b class='flag-5'>AI</b><b class='flag-5'>数据</b>瓶颈

    西部数据与鸿佰科技达成长期合作关系,提供面向AI工作流的高性能、适配网络架构的存算分离存储解决方案

    上海,2025年5月15日 – 西部数据公司(NASDAQ: WDC)与全球领先的电子制造服务供应商富士康科技集团旗下子公司鸿佰科技近日宣布达成战略合作,将联合推出一款全新的旗舰级具有嵌入式存储功能
    发表于 05-15 15:34 1285次阅读

    陶瓷数据存储,寿命可达5000年

    电子发烧友网综合报道,德国陶瓷数据存储新创公司 Cerabyte近日获得西部数据的战略投资,双方将合作推进陶瓷数据存储技术的研发进程。Cer
    的头像 发表于 05-15 00:08 7259次阅读
    陶瓷<b class='flag-5'>数据</b><b class='flag-5'>存储</b>,寿命可达5000年