0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

洛斯阿拉莫斯实验室联手希捷,尝试将计算与机械硬盘相结合

存储界 来源:存储界 2023-03-22 11:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

用于模拟各类场景的高性能计算(HPC)类工作负载,总会产生大量有待筛选的数据。事实上,这也正是HPC与AI的最大区别:前者输入数据少,输出数据多;后者则需要输入大量信息,通过训练转化为神经网络中的少量参数和权重。

但在HPC模拟所生成的数万亿个粒子当中,真正值得研究人员关注的可能只是几百或几千个粒子的实际行为。

洛斯阿拉莫斯国家实验室副部门负责人加里·格里德(Gary Grider)在采访中表示,“这就像是大海捞针,实际要寻找的只是总体数据中的小小一部分。”这个问题在体量较小的数据集上相对好些,但阿拉莫斯实验室却向来以超大规模研究著称。“我们可能会运行一个内存占用量高达PB级别的实验,而它往往每隔几分钟就输出一次PB级数据”,且整个过程会持续半年之久。

为了筛选这些数据,科学家们使用一套分析工具来查明到底哪些信息真正具有价值。过去几年来,阿拉莫斯实验室一直在想办法让分析负载跟数据尽可能接近,甚至考虑把计算转移到闪存或硬盘控制器上。从某种意义上说,阿拉莫斯实验室及其合作伙伴想要构建一套大型磁盘控制器集群,利用上面的空闲时钟周期来处理分析功能。

阿拉莫斯实验室的研究人员已经取得了一定进展。通过与SK海力士合作,他们实现了将规约功能引入控制器的概念验证,借此获得了几个数量级的性能改进。

格里德表示,“我们已经证明,通过对规约这类简单分析的全速执行,磁盘驱动器自身就能从磁盘内提取数据,从而彻底消除了传输带宽产生的成本。”

跟能源部下辖的其他HPC实验室一样,阿拉莫斯实验室同样采用分层存储架构,目前已经开始在更大的磁盘池上做类似的探索。为了更进一步,阿拉莫斯实验室与希捷签订了合作研发协议。

“事实证明,希捷方面也在尝试将部分负载转移到存储设备上。他们已经拥有原型方案,处理器就部署在磁盘驱动器旁边。”

弹性问题

但大家都知道,机械硬盘与闪存不同。闪存内部不存在移动部件,而且在使用寿命之内具有相对更可预测的故障率。相比之下,硬盘驱动器内部存在机械结构,随时都有可能发生故障。这就要求对硬盘做一定程度的弹性化改造——换言之,引入擦除码或RAID。

“但这也会增加分析流程的复杂度。要进行分析,我们必须了解数据是什么。但磁盘驱动器往往做不到它一点,它只会把所有信息都看作数据块。”

因此加里德的团队必须从零开始构建一套专用于存储加速分析的文件系统,否则一切都只是空谈。

“我们不希望这事只有阿拉莫斯实验室自己参与,毕竟我们后续得定期采购、还需要厂商提供售后支持。”

于是,阿拉莫斯实验室选择对现有文件系统做“魔改”,选择的则是Sun Microsystems早年间打造的Zettabyte文件系统。这是一套专门管理大型弹性磁盘驱动器池的系统,如今被人们亲切称为Spinning Rust。ZFS还能配合Gluster实现多节点扩展,Gluster则是Red Hat当初收购来的集群文件系统。至于分析任务,工程师们将努力调整文件系统,让它能与Apache的分析堆栈配合运作。

“我们希望努力打造出任何人都能使用的标准工具。”

虽然阿拉莫斯实验室及其合作伙伴有望构建起一套能够直驱分析处理的文件系统,但其初期部署难度绝不是一般用户所能承受的。

因此,格里德希望进一步完善文件系统和分析工具,吸引标准机构和软件开发者为其添加更多功能,最终打造出一款面向主流受众的新方案。

任重而道远

格里德也承认,这方面还有很多工作要做。“要达到消费级应用的程度,可谓是任重而道远。我们接下来要做的是将其转化成某种对象模型,而不再是文件中的一个个块。”

目前,阿拉莫斯实验室的初步目标是将少量分析功能转移至磁盘控制器。

“我们还没有将完整的分析工作负载转移到磁盘驱动器上,目前做的主要是规约还有一部分合并。但总体来看,规约已经可以在设备层次上实现,之后还有合并和排序这类通常在闪存或内存中实现的操作。”

目前最大的障碍并不是算力,而是磁盘所内置的有限内存。格里德坦言,“现在磁盘的内置内存太小,不足以做排序,只能完成选择操作。所以接下来的问题是,我们要怎样增加磁盘的内置内存容量来提升操作复杂度。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    54

    文章

    9114

    浏览量

    156482
  • 控制器
    +关注

    关注

    114

    文章

    17877

    浏览量

    195101
  • 机械硬盘
    +关注

    关注

    1

    文章

    232

    浏览量

    26275

原文标题:洛斯阿拉莫斯实验室联手希捷,尝试将计算与机械硬盘相结合

文章出处:【微信号:cunchujie,微信公众号:存储界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中微爱芯检测与实验中心正式通过CNAS国家实验室认可

    3月30日,中国合格评定国家认可委员会(CNAS)正式向无锡中微爱芯电子有限公司(以下简称“中微爱芯”)检测与实验中心颁发CNAS实验室认可证书(注册号:CNAS L25597)。CNAS作为国际
    的头像 发表于 04-16 17:25 837次阅读

    3年10亿,携手攻坚:“AI计算开放架构联合实验室”协同创新计划正式启动

    在刚刚结束的光合组织2025人工智能创新大会(HAIC2025)上,一项项助力中国AI产业发展、推动产业底层协同等的关键举措逐一发布,包括30余家生态企业联合发起的“AI计算开放架构联合实验室”首批
    发表于 12-21 16:15 2468次阅读
    3年10亿,携手攻坚:“AI<b class='flag-5'>计算</b>开放架构联合<b class='flag-5'>实验室</b>”协同创新计划正式启动

    华为防火墙通过武汉云黄鹤实验室首批安全公测评级

    今日,武汉云黄鹤实验室(以下简称 “黄鹤实验室”)发布防火墙产品公测的测评结果。华为HiSecEngine防火墙在安全功能与性能测试中整体表现突出,成功通过黄鹤实验室公测,斩获最高“推荐”安全评级。
    的头像 发表于 11-25 15:07 1098次阅读
    华为防火墙通过武汉云黄鹤<b class='flag-5'>实验室</b>首批安全公测评级

    广汽集团试验检测中心风洞实验室荣获CNAS认可

    近日,广汽集团试验检测中心风洞实验室成功通过中国合格评定国家认可委员会(CNAS)现场评审,正式跻身国家认可实验室行列。此次获认可,不仅是对广汽风洞实验室技术能力、质量管理、服务水平的全方位肯定,更标志着
    的头像 发表于 11-18 10:11 832次阅读

    强强联合:之江实验室与沐曦股份共建智算集群联合实验室

    2025年10月22日, 之江实验室与沐曦集成电路(上海)股份有限公司(以下简称“沐曦股份”)正式签署合作协议,共同组建“智算集群联合实验室”,携手推进人工智能算力基础设施创新发展 。之江实验室
    的头像 发表于 10-23 10:50 1553次阅读

    英创汇智获得CNAS实验室认可证书

    近日,英创汇智实验中心顺利通过中国合格评定国家认可委员会(CNAS)的严格评审,正式获得CNAS实验室认可证书(注册号:CNAS L24229)。这标志着公司已建立起符合国际标准的实验室质量管理体系,在产品试验与检测技术能力方面
    的头像 发表于 10-15 17:57 1434次阅读

    兆易创新与纳微半导体数字能源联合实验室揭牌,加速高效电源管理方案落地

    镓以及拥有沟槽辅助平面技术的GeneSiC碳化硅领域的产品优势相结合,面向AI数据中心、光伏逆变、储能、充电桩、电动汽车等新兴市场,提供智能、高效的数字能源解决方案。 夯实数字能源基石,注入强劲“芯”动力 自筹备以来,数字能源联合实验室已取得一系列
    的头像 发表于 10-13 13:52 666次阅读

    上海贝岭跻身国家认可实验室行列

    近日,上海贝岭股份有限公司检测中心可靠性实验室正式通过中国合格评定国家认可委员会(CNAS)的严格评审,获得CNAS认可实验室资质证书(注册号:CNAS L23589)。这标志着上海贝岭在产品可靠性实验领域的技术能力与管理体系达
    的头像 发表于 08-01 09:51 1591次阅读

    SGS与国创臻测实验室达成战略合作

    2025年7月30日,在青岛国创中心,国际公认的测试、检验和认证机构SGS与青岛国创臻测实验室(以下简称“国创臻测”)正式签署战略合作协议,并进行联合实验室授牌仪式,宣布双方在电子电器和微电子类检测认证业务领域建立合作关系。
    的头像 发表于 07-31 14:45 1199次阅读

    TPA智慧实验室,赋能汽车电子测试高效管理!

    平台实现跨地域协同测试,依托数据驱动技术打通信息孤岛,结合可视化大屏构建数字孪生实验室,助力行业伙伴突破汽车电子测试效能瓶颈。跨平台远程测试:设备免接触,执行自动
    的头像 发表于 07-23 14:10 1052次阅读
    TPA智慧<b class='flag-5'>实验室</b>,赋能汽车电子测试高效管理!

    高鸿信安出席飞腾基础软件联合实验室第四届年会

    近日,以 “芯软融合·智启未来”为主题的飞腾基础软件联合实验室(简称 “实验室”)第四届年会暨技术交流分享会在南京顺利召开。大唐高鸿信安(浙江)信息科技有限公司(简称“高鸿信安”)作为实验室成员单位
    的头像 发表于 07-16 15:08 1072次阅读

    Grameenphone参与爱立信与AWS Gen-AI实验室项目

    爱立信×AWS 「Gen-AI实验室」旨在推动运营商在OSS/BSS中的AI应用突破。通过结构化、结果导向的协作方式,实验室将爱立信在OSS/BSS产品组合和行业专业知识方面的深厚积累,与AWS
    的头像 发表于 07-16 10:49 1.6w次阅读

    浦公山实验室正式启动!

    6月21日浦公山实验室在软件园三期正式启动浦公山实验室面向我国信创技术及产业生态,由集美区人工智能产业联盟主要成员单位共同组建,旨在打造覆盖通用计算与数据安全的自主可控人工智能产业软硬件综合创新
    的头像 发表于 06-24 10:11 1125次阅读
    浦公山<b class='flag-5'>实验室</b>正式启动!

    从问题管理到智慧实验室的蝶变之路

    北汇信息PAVELINK平台通过五次重大迭代(问题管理系统→数字化测试平台→自动化测试平台→实验室管理平台→智慧实验室),逐步实现测试全生命周期覆盖,融合自动化调度、智能预警及多区域协同能力,呼应了
    的头像 发表于 05-21 11:05 1705次阅读
    从问题管理到智慧<b class='flag-5'>实验室</b>的蝶变之路

    SGS荣获比亚迪乘用车第三方实验室资质认可证书

    近日,国际公认的测试、检验和认证机构SGS(以下简称:SGS)位于重庆的标瑞新能源实验室(以下简称:SGS-CEC)荣获比亚迪乘用车实验室认可委员会(以下简称:比亚迪)颁发的“乘用车第三方实验室资质认可证书”。
    的头像 发表于 05-20 15:04 1231次阅读