0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

东芝硬盘如何优化存储

东芝硬盘 来源:东芝硬盘 2025-04-11 11:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI加速的关键杠杆

存储优化

铁子们谁懂啊!昨天不到2小时跑完的模型,今天突然变成"树懒速度"!Tell me why?说起“与时间赛跑”的数据,AI工程师妥妥破防,这些场面他们已经见怪不怪了……

多任务并行,变成“抢凳子”游戏

当自然语言处理、推荐系统和图像识别同时开跑,每个任务的训练速度呈指数级下降,大量时间浪费在等待数据加载上。像极了早高峰挤地铁——谁都别想快!

模型迭代,精度与速度孰重?

公司的AI团队每周模型迭代。随着数据累积到一定程度,模型架构也越来越深,每次完整训练超出计划时长。团队含泪在精度和速度之间做起了选择题。

AI训练减速,存储系统也要担责

训练速度变得越来越慢,成了研发效率和创新节奏的绊脚石。导致AI训练速度变慢的原因错综复杂,别急着甩锅给算法,也很可能是存储系统在偷偷"闲置",例如:

1数据洪流与存储带宽不匹配

现代AI模型训练常需要处理TB甚至PB级数据,GPU饿到啃手指,而存储系统却还在用吸管喂数据,大量昂贵的计算资源一时无用武之地。

2随机与顺序读取的失衡

AI深度训练时,会通过数据增强和随机采样技术对原始数据进行旋转、裁剪、打乱等操作,来获得更丰富、更多样化的训练数据!但难点是硬盘得满场“飞檐走壁”读数据,随机读写和顺序读写一旦失衡,容易形成存储访问瓶颈。

3冷热数据一视同仁

训练过程中,本应享受优先待遇的热数据,结果和冷数据一起排队;而本该躺平的冷数据,却抓出来一起卷,结果缓存摆烂、分布式训练时全员卡顿。

存储优化,让数据跑起来!

算力和存储就像印刷厂的神仙CP,计算会像“机器印刷文字”一样生成大量token(词元),而存储就是“纸张”。AI模型训练,大规模的算力要求存储系统提供更高性能的数据访问,就如印刷机提速了,纸张的质量和供应速度也要同频给力。那如何优化存储呢?

1 智能分层:数据科学分管

智能分层存储系统通过实时监控数据访问模式,自动将频繁访问的"热数据"配"超跑",常驻高速存储,将不常访问的冷数据妥善保管,"温数据"存在平衡性能与成本的中间层。可显著提升缓存命中率,减少等待时间。

2并行存储:突破带宽瓶颈

分布式存储系统,通过将数据分散在多个节点上,实现了聚合带宽的线性增长。把数据分散部署,系统统一指挥,团队战速!告别"单车道堵车",满足大规模分布式训练的需求。

作为分布式存储系统的其中一部分,HDD硬盘在其中大有作为。东芝MG10系列20TB企业级硬盘,采用CMR传统磁记录技术,20TB海量存储空间+7200rpm转速、最大数据传输速度达268MiB/s,让数据输送从"乡村小路"升级为"高铁"!且额定工作负载高达550TB/年,平均无故障时间达250万小时,高耐用性适用于写入密集的训练场景。

By the way,云存储的弹性优势也不容忽视,突发性训练任务,资源秒扩容,绝不掉链子。结合本地缓存加速,可构建混合云训练环境,速度省钱它都给!

在AI训练的全栈优化中,存储配置往往能以较小杠杆,撬动显著的加速效果,根据分析训练任务的数据访问模式、带宽需求和延迟敏感度,选择匹配的存储架构,可以给企业狠狠上大分,充分释放计算资源潜力,保持竞争优势!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 东芝
    +关注

    关注

    7

    文章

    1517

    浏览量

    124811
  • 存储
    +关注

    关注

    13

    文章

    4934

    浏览量

    90389
  • AI
    AI
    +关注

    关注

    91

    文章

    41984

    浏览量

    303080

原文标题:福利 | 解决AI“龟速”烦恼的性能优化秘籍

文章出处:【微信号:Toshiba-Electronics,微信公众号:东芝硬盘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    东芝启动30-34 TB SMR近线硬盘样品出货

    东芝电子元件及存储装置株式会社(简称“东芝”)宣布推出3.5英寸[1]M12 系列近线硬盘 (HDD),专为运营大型数据中心的超大规模(Hyperscale)及云服务提供商设计。目前率
    的头像 发表于 04-01 10:52 1700次阅读

    星载存储架构演进:天硕XMC固态硬盘如何实现航天存储的可控性提升

    星载存储系统的单点失效并非源于单一器件,而是数据路径在多层机制叠加下的系统性风险。本文从航天工程实践出发,结合天硕航天存储等行业路径,解析航天级SSD固态硬盘如何通过分层容错与系统协同设计,实现数据链路的可预测与可恢复。
    的头像 发表于 03-30 15:19 462次阅读

    东芝完成12盘片堆叠验证,40TB硬盘稳步推进 东芝从技术验证走向到工程实现

    东芝硬盘在中国市场建立了近线硬盘(Nearline HDD)产线并成功实现量产。在硬盘产品的研发中积累了丰富的先进设计与分析技术,此次12盘片堆叠技术的突破,正是在现有10盘片3.5英
    的头像 发表于 03-13 18:03 1816次阅读
    <b class='flag-5'>东芝</b>完成12盘片堆叠验证,40TB<b class='flag-5'>硬盘</b>稳步推进 <b class='flag-5'>东芝</b>从技术验证走向到工程实现

    东芝开发出可详细阐明磁头内自旋扭矩振荡元件振荡状态的评估方法

    的评估方法。 具备低成本储庞大量数据的机械硬盘,至今仍是重要的存储设备,且市场对更高记录密度的需求持续增长。东芝致力于同时开发共振型微波辅助磁记录(MAS-MAMR)和热辅助磁记录(HAMR)两項技术,其中,在MAS-MAMR方
    的头像 发表于 02-12 15:13 825次阅读
    <b class='flag-5'>东芝</b>开发出可详细阐明磁头内自旋扭矩振荡元件振荡状态的评估方法

    【服务器数据恢复】EVA存储硬盘离线,LUN丢后数据如何“重生”?

    将故障EVA存储设备上的所有硬盘编号后取出。硬件工程师对所有硬盘进行硬件故障检测。检测后发现掉线硬盘不存在物理故障和坏道。将所有硬盘以只读方
    的头像 发表于 01-22 17:39 1320次阅读

    东芝硬盘荣膺2025 IDC中国生态奖伙伴能力建设奖

    近日,2025 IDC中国生态峰会暨颁奖典礼在北京隆重召开。峰会汇聚IT生态核心伙伴、技术领袖及行业精英,共同探讨生态协同新路径,并表彰推动行业创新发展的标杆企业。东芝硬盘凭借在赋能合作伙伴、IT生态领域的卓越贡献,荣获“伙伴能力建设奖”。
    的头像 发表于 12-31 09:31 380次阅读

    东芝企业级硬盘创新技术炼就存储基石

    当企业数据中心的海量需求遇上日益精进的存储技术,一块硬盘的价值早已超越简单的容量数字范畴。今天,与芝迷妹一起聊聊东芝在企业级硬盘采用的关键技术,感受其背后务实而创新的 “技术哲学”。
    的头像 发表于 12-19 14:59 948次阅读

    当AI运行遭遇存储瓶颈:一个专业硬盘盒如何让性能提升40%?

    您的高速硬盘选择一个卓越的搭档——这正是ICYDOCK硬盘盒的核心价值。专业硬盘盒是AI存储的关键环节。普通硬盘盒受限于散热设计与接口带宽,
    的头像 发表于 11-28 15:29 865次阅读
    当AI运行遭遇<b class='flag-5'>存储</b>瓶颈:一个专业<b class='flag-5'>硬盘</b>盒如何让性能提升40%?

    东芝推出全新S300 AI监控硬盘

    日本川崎2025年11月4日 ——东芝电子元件及存储装置株式会社(东芝)推出新一代 S300 AI 监控硬盘 (HDD),专为满足现代人工智能 (AI) 视频监控应用需求而打造。S30
    的头像 发表于 11-06 15:58 9988次阅读

    东芝硬盘率先完成 12 盘片堆叠技术验证

    –预计在 2027 年推出新一代 40TB硬盘 – [日本川崎2025年10月14日]—— 东芝电子元件及存储装置株式会社(简称“东芝”)成为首位[1] 成功验证高容量
    的头像 发表于 10-17 14:26 986次阅读

    东芝硬盘率先完成12盘片堆叠技术验证 预计在2027年推出新一代40TB硬盘

    东芝硬盘率先完成 12盘片堆叠技术验证   – 预计在2027年推出新一代40TB硬盘 – 日本川崎2025年10月14日 东芝电子元件及存储
    的头像 发表于 10-14 11:19 2056次阅读

    如何选对硬盘转接架?这份选购指南让你不再踩坑

    您是否在为扩展存储空间而烦恼?ICYDOCK硬盘转接架是您的完美解决方案。它能将多个硬盘安装到单个标准硬盘槽中,显著提升存储密度和兼容性。通
    的头像 发表于 09-05 16:17 889次阅读
    如何选对<b class='flag-5'>硬盘</b>转接架?这份选购指南让你不再踩坑

    通过PCIe插槽硬盘优化企业级U.2/U.3 SSD存储方案

    PCIe硬盘抽取盒会成为NVMe存储的未来?PCIe硬盘抽取盒可将任何闲置的PCIe插槽位转换为支持插拔的NVMeSSD扩展坞(兼容U.2/U.3SSD),既能保证极
    的头像 发表于 08-21 17:54 2181次阅读
    通过PCIe插槽<b class='flag-5'>硬盘</b>盒<b class='flag-5'>优化</b>企业级U.2/U.3 SSD<b class='flag-5'>存储</b>方案

    存储数据恢复—EqualLogic存储硬盘指示灯亮黄色导致存储不可用的数据恢复

    一台EqualLogic存储上有一组由16块SAS硬盘组成的RAID5阵列。上层部署VMFS,存放的数据是虚拟机文件。存储系统上层划分4个卷。 RAID5阵列2块硬盘的指示灯亮黄色,
    的头像 发表于 07-31 13:16 663次阅读
    <b class='flag-5'>存储</b>数据恢复—EqualLogic<b class='flag-5'>存储</b><b class='flag-5'>硬盘</b>指示灯亮黄色导致<b class='flag-5'>存储</b>不可用的数据恢复

    东芝硬盘亮相昱格国产化生态大会

    近日,东芝硬盘受邀参加了由昱格主办的国产化生态大会,与行业专家、合作伙伴共同探讨国产化生态发展的新趋势、新机遇与新挑战 ,共筑数字化生态新未来。
    的头像 发表于 06-09 18:10 1521次阅读