0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

冰上的大数据

星星科技指导员 来源:嵌入式计算设计 作者:Brandon Lewis 2022-08-17 09:40 次阅读

波音喷气发动机每运行 30 分钟,就会产生 10 TB 的数据。那是 1 万亿字节,或相当于美国国会图书馆整个印刷馆藏的数字化等价物。将其乘以每天在美国上空推动超过 87,000 次航班的喷气发动机数量,您就会获得大量数据。

尽管一些人猜测大数据不会转化为分析疗法,但它仍然与物联网IoT) 密不可分。如果思科等公司的预测是正确的,那么到 2020 年,我们将有大约 500 亿个支持互联网的“事物”不断地啁啾,虽然它们可能不会都在喷气发动机剪辑上生成数据,但这绝对构成了数据海啸。

那么,我们将如何处理所有这些数据?收获的信息必须在某种程度上具有价值,否则它一开始就不会被收获。另一方面,并​​非所有数据都是平等的。收集到的绝大多数数据可能会被存档和遗忘,直到偶尔报告需要它,访问一次或两次,然后再次被遗忘。根据 Enterprise Strategy Group 的研究,这种“不经常访问”的信息(也称为第 3 层或“冷”数据)占记录数据的 80%。而且,尽管这些年来内存的平均成本急剧下降,但在大数据规模上,每 GB 几美分的成本可以很快加起来。

这种信息过载的明显答案是冷数据存储替代方案,它们比用于定期访问的数据更便宜且容量更大。因此,公司通常选择以下两种解决方案之一:历史悠久的磁带库,或者最近的云。

磁带库已经使用了几十年,非常适合以极低的成本存储大量数据。它们也可以被认为是“绿色的”,因为磁带驱动器仅在使用时旋转(这可以节省电力),并且位于内部可以相对快速地访问冷数据。然而,磁带库也有一些缺点,包括大中型存储系统的前期费用高昂、远程访问困难、磁带退化的可能性以及在单个现场位置维护档案的漏洞。而不是“数据海啸”想想“数据”和“海啸”)。

公司探索云存储的可能性,通过提供无限的存储空间、低成本以及防止盗窃、自然灾害等的远程容量,弥补了磁带库的一些疑虑。然而,云解决方案的主要特点是检索数据通常非常耗时,并且可能会变得昂贵,具体取决于检索的数据量。例如,Amazon Glacier 之类的服务至少需要 3-5 小时来检索数据集(可在 24 小时内下载),如果在给定的数据中检索到超过 5% 的数据,则按千兆字节收费月。

两者的交叉点似乎会有所改进,并包含优化访问的硬件和软件元素,同时确保每 GB 存储的成本尽可能低。

冷藏:冰上的大数据

软件定义存储 (SDS) 是一个新术语,但从技术角度来看,它类似于软件定义网络 (SDN),因为硬件逻辑被抽象为管理存储基础设施的软件层。从本质上讲,这意味着可以虚拟化存储功能或服务(如重复数据删除、复制、快照和精简配置),从而实现在商用硬件上运行的融合存储架构。因此,可以实施具有成本效益的存储策略,将磁带库的可访问性和效率与云的可扩展性和远程功能相结合。

例如,由 Storiant 提供支持的 RGS Cold Storage 是针对第 3 层数据的本地存储解决方案,它基于 Avnet, Inc. 的业务部门 RGS 的现成硬件。机柜级设备与 60 个提供 PB 级容量的 HDD 托架完全集成,并利用基于 OpenZFS 的 Storiant 软件(以前称为 SageCloud)与私有云接口。Storiant 数据管理软件还提高了访问性能,将处于停滞状态的数据的检索时间缩短至 30 秒,同时允许 HDD 在不使用时减速以显着降低功耗。可扩展的 RGS 冷存储架构每月每 GB 存储 0.01 美元,针对大多数大数据部署进行了成本优化。

虽然 SDS 等存储管理技术有助于为有价值的业务分析奠定基础,但它们还确保财务和计算资源可用于定期执行的“第 1 层”数据。在一个过多的信息实际上会变成一件坏事的环境中,将其中的一些信息保持在深度冻结状态是很重要的。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 发动机
    +关注

    关注

    33

    文章

    2320

    浏览量

    67462
  • 物联网
    +关注

    关注

    2867

    文章

    41615

    浏览量

    358322
  • SDS
    SDS
    +关注

    关注

    0

    文章

    45

    浏览量

    15123
收藏 人收藏

    评论

    相关推荐

    CYBT-343026传输大数据时会丢数据的原因?

    我正在使用 CYBT-343026 (CYW-20706 Silicon) 模块。 我根据 SPP 样本制作了一个操作 SPP 的应用程序。 但是,传输大数据时有时会丢失数据。 它从
    发表于 03-01 15:04

    大数据技术是干嘛的 大数据核心技术有哪些

    大数据技术是指用来处理和存储海量、多类型、高速的数据的一系列技术和工具。现如今,大数据已经渗透到各个行业和领域,对企业决策和业务发展起到了重要作用。本文将详细介绍大数据技术的概念、发展
    的头像 发表于 01-31 11:07 757次阅读

    Get职场新知识:做分析,用大数据分析工具

    综合分析。但现在有了大数据分析工具,一切问题都可迎刃而解。 大数据分析工具,顾名思义就是专门为分析海量数据而开发的一类工具。这类工具具有极强的大数据分析、指标计算、
    发表于 12-05 09:36

    大数据是人工智能吗

    大数据是人工智能吗 随着互联网技术和数据采集技术的发展,数据量不断增大,大数据应运而生。大数据技术的出现,使得
    的头像 发表于 08-12 17:12 982次阅读

    数据基础(2)#大数据

    大数据
    未来加油dz
    发布于 :2023年07月18日 13:18:38

    数据基础(1)#大数据

    大数据
    未来加油dz
    发布于 :2023年07月18日 13:17:52

    大数据可视化的应用案例(上)(2)#大数据

    大数据
    未来加油dz
    发布于 :2023年07月18日 13:12:28

    大数据华而不实么?大数据的本质是什么?

    随着科技的发展和信息技术的迅猛进步,大数据概念逐渐走入人们的视野,成为各行各业的热门话题。然而,一些人对大数据持怀疑态度,认为其只是一种虚幻的概念,华而不实。那么,大数据的本质究竟是什么呢?
    的头像 发表于 07-12 15:58 337次阅读

    大数据基本概念(2)#大数据分析

    大数据
    学习硬声知识
    发布于 :2023年07月11日 14:02:01

    智慧农业大数据

    智慧农业,作为未来农业的发展方向,其实现基于种植环境、生长管理、农机设备等数据。农业大数据核心在于技术,包括获取技术和处理数据技术。相比工业大数据技术,获取技术的多样性和复杂程度更高,
    的头像 发表于 07-10 16:18 572次阅读

    制造业怎么应用大数据

    随着信息技术的迅猛发展,大数据正逐渐成为各行各业的重要资源和工具。在制造业中,大数据的应用也逐渐得到了广泛关注。
    的头像 发表于 07-07 10:31 626次阅读

    大数据安全有哪些挑战

    大数据安全一直是一个令人担忧的问题,因为大数据是网络入侵者的重要目标。如果遭遇勒索软件攻击,可能使企业的大数据部署面临赎金要求。更糟糕的是,未经授权的用户可能会访问企业的大数据,以窃取
    的头像 发表于 05-19 11:46 1160次阅读

    大数据有何特点?

    随着科技的不断发展,大数据已经成为当今信息化时代的主要驱动力之一。大数据的特点是什么?
    的头像 发表于 05-12 10:27 1936次阅读

    大数据的特征及技术关键

    大数据的定义多而杂,不同企业、行业等都从自身角度来定义大数据,意思都差不多,就一句话,大数据由巨型数据集组成,这些数据集规模超出了常用软件在
    的头像 发表于 05-10 15:32 1232次阅读

    大数据是什么 大数据存储的概念 大数据应用场景有哪些

    大数据的成功管理取决于几个方面,例如数据的收集、存储、处理、分析和可视化。在大数据的处理过程中,各种技术和算法也被不断地应用于解决各种问题。大数据技术将继续发展和应用于各种领域,成为管
    发表于 05-03 09:23 2799次阅读