0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

洛斯阿拉莫斯实验室联手希捷,尝试将计算与机械硬盘相结合

存储界 来源:存储界 2023-03-22 11:20 次阅读

用于模拟各类场景的高性能计算(HPC)类工作负载,总会产生大量有待筛选的数据。事实上,这也正是HPC与AI的最大区别:前者输入数据少,输出数据多;后者则需要输入大量信息,通过训练转化为神经网络中的少量参数和权重。

但在HPC模拟所生成的数万亿个粒子当中,真正值得研究人员关注的可能只是几百或几千个粒子的实际行为。

洛斯阿拉莫斯国家实验室副部门负责人加里·格里德(Gary Grider)在采访中表示,“这就像是大海捞针,实际要寻找的只是总体数据中的小小一部分。”这个问题在体量较小的数据集上相对好些,但阿拉莫斯实验室却向来以超大规模研究著称。“我们可能会运行一个内存占用量高达PB级别的实验,而它往往每隔几分钟就输出一次PB级数据”,且整个过程会持续半年之久。

为了筛选这些数据,科学家们使用一套分析工具来查明到底哪些信息真正具有价值。过去几年来,阿拉莫斯实验室一直在想办法让分析负载跟数据尽可能接近,甚至考虑把计算转移到闪存或硬盘控制器上。从某种意义上说,阿拉莫斯实验室及其合作伙伴想要构建一套大型磁盘控制器集群,利用上面的空闲时钟周期来处理分析功能。

阿拉莫斯实验室的研究人员已经取得了一定进展。通过与SK海力士合作,他们实现了将规约功能引入控制器的概念验证,借此获得了几个数量级的性能改进。

格里德表示,“我们已经证明,通过对规约这类简单分析的全速执行,磁盘驱动器自身就能从磁盘内提取数据,从而彻底消除了传输带宽产生的成本。”

跟能源部下辖的其他HPC实验室一样,阿拉莫斯实验室同样采用分层存储架构,目前已经开始在更大的磁盘池上做类似的探索。为了更进一步,阿拉莫斯实验室与希捷签订了合作研发协议。

“事实证明,希捷方面也在尝试将部分负载转移到存储设备上。他们已经拥有原型方案,处理器就部署在磁盘驱动器旁边。”

弹性问题

但大家都知道,机械硬盘与闪存不同。闪存内部不存在移动部件,而且在使用寿命之内具有相对更可预测的故障率。相比之下,硬盘驱动器内部存在机械结构,随时都有可能发生故障。这就要求对硬盘做一定程度的弹性化改造——换言之,引入擦除码或RAID。

“但这也会增加分析流程的复杂度。要进行分析,我们必须了解数据是什么。但磁盘驱动器往往做不到它一点,它只会把所有信息都看作数据块。”

因此加里德的团队必须从零开始构建一套专用于存储加速分析的文件系统,否则一切都只是空谈。

“我们不希望这事只有阿拉莫斯实验室自己参与,毕竟我们后续得定期采购、还需要厂商提供售后支持。”

于是,阿拉莫斯实验室选择对现有文件系统做“魔改”,选择的则是Sun Microsystems早年间打造的Zettabyte文件系统。这是一套专门管理大型弹性磁盘驱动器池的系统,如今被人们亲切称为Spinning Rust。ZFS还能配合Gluster实现多节点扩展,Gluster则是Red Hat当初收购来的集群文件系统。至于分析任务,工程师们将努力调整文件系统,让它能与Apache的分析堆栈配合运作。

“我们希望努力打造出任何人都能使用的标准工具。”

虽然阿拉莫斯实验室及其合作伙伴有望构建起一套能够直驱分析处理的文件系统,但其初期部署难度绝不是一般用户所能承受的。

因此,格里德希望进一步完善文件系统和分析工具,吸引标准机构和软件开发者为其添加更多功能,最终打造出一款面向主流受众的新方案。

任重而道远

格里德也承认,这方面还有很多工作要做。“要达到消费级应用的程度,可谓是任重而道远。我们接下来要做的是将其转化成某种对象模型,而不再是文件中的一个个块。”

目前,阿拉莫斯实验室的初步目标是将少量分析功能转移至磁盘控制器。

“我们还没有将完整的分析工作负载转移到磁盘驱动器上,目前做的主要是规约还有一部分合并。但总体来看,规约已经可以在设备层次上实现,之后还有合并和排序这类通常在闪存或内存中实现的操作。”

目前最大的障碍并不是算力,而是磁盘所内置的有限内存。格里德坦言,“现在磁盘的内置内存太小,不足以做排序,只能完成选择操作。所以接下来的问题是,我们要怎样增加磁盘的内置内存容量来提升操作复杂度。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    51

    文章

    7319

    浏览量

    142988
  • 控制器
    +关注

    关注

    112

    文章

    15239

    浏览量

    171224
  • 机械硬盘
    +关注

    关注

    1

    文章

    210

    浏览量

    25182

原文标题:洛斯阿拉莫斯实验室联手希捷,尝试将计算与机械硬盘相结合

文章出处:【微信号:cunchujie,微信公众号:存储界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    要让量子计算走出实验室

    转自环球时报环球时报记者张蔚蓝陈子帅原稿标题:中国科学院量子信息重点实验室副主任郭国平:要让量子计算走出实验室原文链接:https://m.huanqiu.com/article
    的头像 发表于 03-06 08:21 117次阅读
    要让量子<b class='flag-5'>计算</b>走出<b class='flag-5'>实验室</b>

    索尼将与希捷合作让机械硬盘容量翻倍满足AI需求

    随着人工智能(AI)技术的广泛应用和快速发展,数据储存需求呈现爆炸性增长。为应对这一挑战,科技巨头索尼宣布将与硬盘驱动器行业的领导者希捷科技进行深度合作。根据最新消息,索尼计划通过引入新型半导体元件,将机械
    的头像 发表于 02-20 17:34 434次阅读

    上海AI实验室发布新一代书生·视觉大模型

    近日,上海人工智能实验室(上海AI实验室联手多所知名高校及科技公司共同研发出新一代书生·视觉大模型(InternVL)。
    的头像 发表于 02-04 11:25 642次阅读

    固态硬盘机械硬盘区别在哪

    固态硬盘(SSD)和机械硬盘(HDD)是两种不同类型的存储设备,它们在技术原理、速度、可靠性、功耗、噪音等方面有着相当大的区别。在本文中,将详细介绍固态硬盘
    的头像 发表于 01-18 09:43 737次阅读

    固态硬盘寿命和机械硬盘寿命哪个更长

    固态硬盘机械硬盘是常见的计算机存储设备,它们的寿命是一个重要的关注点。虽然两者都有自己的优点和限制,但总体来说,固态硬盘的寿命通常比
    的头像 发表于 01-16 10:10 1051次阅读

    希捷发布全球第二款24TB超大容量的机械硬盘

    继银河Exos X24之后,希捷近日发布了全球第二款24TB超大容量的机械硬盘,这次隶属于SkyHawk AI酷鹰人工智能系列,主要面向边缘和安防领域的视频图像应用(VIA)。
    的头像 发表于 12-28 10:04 391次阅读
    <b class='flag-5'>希捷</b>发布全球第二款24TB超大容量的<b class='flag-5'>机械</b><b class='flag-5'>硬盘</b>

    SiBORG实验室使用OpenUSD和NVIDIA Omniverse改进可达性设计

    SiBORG 实验室负责人 Mathew Schwartz 将研究与设计相结合,帮助团队优化建筑物的可达性设计。
    的头像 发表于 12-22 17:11 286次阅读

    机械硬盘和固态硬盘的工作原理

    机械硬盘和固态硬盘的工作原理 机械硬盘(Mechanical Hard Disk Drive, HDD)和固态
    的头像 发表于 12-07 16:52 658次阅读

    PCR基因扩增实验室装修设计解决方案-生命科学

    产品检测,动物饲料、化妆品、食品卫生检测,转基因作物与转基因微生物检测等。PCR实验室即基因扩增实验室,PCR实验室的分区规划怎么做?PCR实验室的建设设计要点有哪些?PCR
    发表于 09-19 14:28

    浅析新型光子偏振片照亮量子通信之路

    洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)的研究人员开发了一种技术,可以比现有方法更容易、更便宜地产生偏振光子。
    的头像 发表于 09-14 16:39 819次阅读

    希捷酷狼Pro 22TB硬盘评测

    现在固态硬盘机械硬盘的使用场景可谓泾渭分明:笔记本以及个人台式主机基本上以SSD为主,而NAS存储、安全监控等设备则是机械硬盘的天下。
    的头像 发表于 08-02 09:57 787次阅读
    <b class='flag-5'>希捷</b>酷狼Pro 22TB<b class='flag-5'>硬盘</b>评测

    实验室安全高压气路设计方案

    概述: 实验室安全高压气路设计方案为实现实验室简洁、高端化而设计,采用高纯气体中央供气系统是专为高精度压力测试设备所用高纯工作气体的传输而设计,系统需要为各压力标准设备提供压力、流量稳定且经过传输后
    发表于 08-01 15:57

    希捷50TB机械硬盘拍马赶来!单碟容量冲上5TB

    每次公布季度财报后,希捷都会放出一份路线图,展望机械硬盘的未来发展,俗称“画饼”。
    的头像 发表于 06-11 15:08 1007次阅读
    <b class='flag-5'>希捷</b>50TB<b class='flag-5'>机械</b><b class='flag-5'>硬盘</b>拍马赶来!单碟容量冲上5TB

    实验室安全高压气路设计方案

    概述: 实验室安全高压气路设计方案为实现实验室简洁、高端化而设计,采用高纯气体中央供气系统是专为高精度压力测试设备所用高纯工作气体的传输而设计,系统需要为各压力标准设备提供压力、流量稳定且经过传输后
    发表于 05-26 16:54

    双鸟机械起重产品检测实验室获TUV莱茵授权实验室资质

    ”)颁发了授权实验室资质。浙江双鸟机械有限公司总经理盛嘉庆、研究院院长赵定元,TUV莱茵大中华区认可与认证经理Gerd Reimann等双方代表出席了授牌仪式。 双鸟机械起重产品检测实验室
    的头像 发表于 05-19 05:30 469次阅读
    双鸟<b class='flag-5'>机械</b>起重产品检测<b class='flag-5'>实验室</b>获TUV莱茵授权<b class='flag-5'>实验室</b>资质