0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对象存储中的五个要素

电子工程师 来源:开源云中文社区 作者:开源云中文社区 2019-11-11 14:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一般来说,当人们考虑对象存储时,只考虑一件事——每TB/GB的价格。尽管这是一个不错的成本指标,但它的作用是使对象存储一维化,并将其降级为存档用例。此外,它扭曲了企业技术堆栈中这一日益重要的部分的价值。

坦率地说,这应该归咎于传统对象存储厂商。多年来,它们在技术方面创新不足,转而提供更便宜的产品。它们还会说这就是顾客想要的,但它们错了。

AWS去年收入达250亿美元可作为证据——其中绝大多数是高性能的主要对象存储。如果我们保守地将S3存储服务的规模算为200亿美元,可以说,S3的规模是其他厂商的总和。再加上价格相似、增长迅速的Azure Blob和Google Cloud,情况就明朗了——成本只是一个考虑因素。

这就是为什么现代企业关注的是更广泛的一系列指标——强调性能、运维效率、灵活性和价格的指标,而不仅仅是价格。他们认识到将数据放在“冰上”会降低其价值。在目标是最大化组织数据的价值的时候,供应商的方法似乎与之背道而驰。

企业应该考虑什么?这分为五大类:性能、可扩展性、S3兼容性、故障响应、一致性。成本之外,这五个要素定义了对象存储中的新指标。

性能

传统上,对象存储并不以性能着称。在价格竞争中,厂商不断牺牲性能。现代对象存储改变了这一点。

从Amazon到Minio,我们都看到了接近甚至超过Hadoop的速度。新的对象存储指标涉及到读写速度(HDD为10GB/s,NVMe为35+GB/s)。对于Spark、Presto、TensorflowTeradata、Vertica、Splunk和分析堆栈中的其他现代计算框架来说,这种吞吐量非常快。MPP数据库以对象存储为目标这一事实证明,对象存储越来越成为主要存储。

如果对象存储系统无法提供这些速度,则无法与所有数据交互,也无法从中提取价值。即使你将数据从传统对象存储中提取到内存中的处理框架中,你仍然需要吞吐量来将数据往返于该内存中——你根本无法从传统对象设备获得这样的吞吐量。

这是一个关键点。新的性能指标是吞吐量,而不是延迟。这是大规模数据所需要的——这是现代数据基础设施中的一个标准。

应该注意的是,虽然性能基准是一个很好的代理,但是只有在该环境中运行了特定的应用程序之后,才能真正知道性能是什么样子的。只有这样,它们才能理解瓶颈到底是什么,是存储软件、驱动器、网络还是计算层。

可伸缩性

可伸缩性通常指一个命名空间中的PB数。每个供应商都声称zeta规模,但隐藏了这样一个事实:随着规模的扩大,庞大的、单体的系统变得脆弱、复杂、不稳定和昂贵。

可伸缩性的新指标是你可以处理多少个不同的命名空间或租户。

这个指标是直接从hyper-scaler中获取的,其中,构建块很小,但可以扩展到数十亿个。简而言之,这是云原生的方式。

当构建块很小时,一切都可以更有效地理解和优化——安全性、访问控制、策略管理、生命周期管理、无中断升级和更新以及最终的性能。构建块的大小是故障域可管理性的函数。这就是高弹性系统的架构。

多租户在现代企业中具有多个维度。当然,它指的是企业如何组织对数据和应用程序的访问,它也指应用程序本身以及它们在逻辑上如何相互隔离。

现代多租户方法具有以下特点:

——租户可以在短时间内从几百个发展到几百万个。

——租户之间完全隔离,使它们能够运行具有不同配置、权限、功能、安全性和服务级别的同一对象存储软件的不同版本。当扩展新服务器、更新和地理位置时,这是一个实际的运维问题。

——有弹性和按需。

——每个操作都是API驱动的,自动化的,没有人看仪表板。

——软件足够轻量,可以进行容器化,并利用Kubernetes等行业标准的编排服务。

S3兼容性

Amazon S3 API是对象存储的事实标准,以至于每个对象存储软件供应商都声称与之兼容。也就是说,AWS S3的兼容性实际上是二元的。S3兼容性的指标是1。

这意味着,有成百上千的“角落”用例并没有如你所愿发生。这对专有软件或设备供应商来说尤其具有挑战性。原因是,它们的大多数用例都是直接存档或备份,因此API调用的多样性很低,而且用例非常同质。显然,这是一个开源软件具有显着优势的领域。考虑到应用程序、操作系统和硬件架构的大小和多样性,足以覆盖大多数“角落”用例。

对应用程序创建者来说,这很重要。你需要测试应用程序。开源使评估供应商声明和确定平台对应用程序性能的影响变得容易。如果你的供应商足够好,可以作为一个门户,并被其他人作为一个门户,那么你可以有信心,它能满足你的需要。关于开源和S3的最后一点是,开源意味着企业避免了供应商锁定,提高了透明度。

关于S3兼容,如果你正在运行大数据应用程序,S3 SELECT通过用SQL从对象存储中只提取所需的内容,可以大大提高性能和效率。

另外,对bucket通知的支持也是关键。bucket通知有助于无服务器计算——这是任何基于微服务的功能即服务中的关键组件。假设对象存储是云中存储的事实标准,那么当将对象服务器公开给云原生应用程序时,此功能是必须的。

最后,S3实现需要支持Amazon S3服务器端加密API(SSE-C、SSE-S3、SSE-KMS)。更棒的是,它应该支持可证明足够安全的防篡改。

故障

在对象存储中,最容易被忽略的指标可能是系统如何处理故障。故障会发生,有多种形式。对象存储系统需要优雅地处理所有这些问题。

例如,如果存在单点故障,那么这个指标是零。

不幸的是,许多对象存储系统将使用“特殊”节点,这些节点必须启动才能使集群正常工作。其中包括名称节点或元数据服务器。这就会造成单点故障。

即使有多个故障点,承受灾难性失败的能力也是至关重要的。驱动器会出现故障,服务器会坏。关键是采用将故障视为正常情况的软件。这意味着,当磁盘或节点关闭时,软件可以不受影响地继续运行。

inline erasure coding和bitrot protection带来的革命确保在软件返回数据之前,你可以丢失与奇偶校验块一样多的磁盘或节点(这通常是驱动器的一半)。

故障很少大规模测试,但应该是强制性的。模拟负载下的故障将提供故障总成本(数据丢失、时间和技能)的准确消息。

一致性

一致性的指标是100%。一致性是任何存储系统中的一个关键组件,但严格的一致性很少。例如,Amazon S3 ListObject不是严格一致的,它只是最终一致的。

严格一致性是什么意思?对于确认的PUT操作之后的所有操作,必须保持以下状态:更新的值在从任何节点读取时都可见;更新带有冗余,免受节点故障的影响。

这意味着,如果在写入过程中拔出插头,不会丢失任何内容。结果是系统永远不会返回损坏或过时的数据。这是一个很高的标准,对交易型应用程序到备份和恢复用例都有影响。

结论

这些是对象存储中的新指标,反映了现代企业的使用模式,其中性能、一致性、可伸缩性、故障域和S3兼容性是云原生应用程序和大数据分析的基础。在构建现代数据堆栈时,除了考虑成本之外,别忘了这几个指标。

责任编辑:zl

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    54

    文章

    9129

    浏览量

    156925
  • 存储
    +关注

    关注

    13

    文章

    4934

    浏览量

    90389
  • API
    API
    +关注

    关注

    2

    文章

    2506

    浏览量

    67138
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI Ceph 分布式存储教程资料大模型学习资料2026

    的系统工程。通过深度剖析 AI 分布式存储的实战技术,我们构建了一条通往 AGI(通用人工智能)的高速数据公路。在这场科技竞赛,只有掌握了高性能存储这一关键基建,才能让算力引擎全速运转,让数据
    发表于 05-01 17:35

    数字化的基础是什么

    数字化的基础是多个关键要素的有机结合,这些要素共同构成了数字化技术、应用和生态的底层支撑。其核心基础可归纳为以下层面: 1. 数据:数字化的核心资产 数据采集与生成 :通过传感器、
    的头像 发表于 02-04 17:53 1395次阅读

    曙光存储连续斩获两行业奖项

    近期,曙光存储连续斩获两行业奖项,自研技术产品在国产突破、AI行业应用等方面的成果获得广泛关注。
    的头像 发表于 01-15 16:28 2790次阅读

    2025 企业 IT 成本翻倍?华为云对象存储让数据存储成本直降 20%

    2025 年,全球存储硬件市场的价格狂飙让企业 IT 部门陷入两难境地。作为固态硬盘核心组件的 NAND Flash,自 2025 年第一季以来价格累计上涨高达 246%,其中 70% 的涨幅集中在
    的头像 发表于 12-31 12:57 528次阅读

    ETAS INCA软件的实用进阶功能

    在上一篇文章我们介绍了INCA软件如何赋能高效的ECU开发及新能源挑战,本篇内容将继续深入探讨INCA的实用进阶功能。
    的头像 发表于 12-08 16:42 2870次阅读
    ETAS INCA软件的<b class='flag-5'>五</b><b class='flag-5'>个</b>实用进阶功能

    利用e203NICE协处理器加速滤波运算

    资源有限,不能将所有的数据都加载到NICE,本实现在NICE放置八组32位寄存器,分别存储四组ifm与四组weight数据。考虑到有效数据当且仅当循环结束时才返回一结果数据,所以
    发表于 10-21 13:40

    基于e203NICE协处理器加速滤波运算

    资源有限,不能将所有的数据都加载到NICE,本实现在NICE放置八组32位寄存器,分别存储四组ifm与四组weight数据。考虑到有效数据当且仅当循环结束时才返回一结果数据,所以
    发表于 10-21 09:54

    气象多要素在各场景的实际运用

    气象监测体系,风速、风向、温度、湿度、气压、雨量、光照七大核心要素的精准捕捉构成气象服务的基础支撑。这些要素的协同监测通过多传感器集成技术实现,其数据质量直接影响气象预报准确性与行业应用价值。
    的头像 发表于 10-20 11:48 654次阅读
    气象多<b class='flag-5'>要素</b>在各场景<b class='flag-5'>中</b>的实际运用

    能源数字化转型核心!一张图揭秘绿电直连“流合一”超级架构

    本文将化繁为简,通过“源、网、荷、储、碳”大核心要素,为您全景解析其系统架构,揭秘如何实现“流合一”的智慧协同。
    的头像 发表于 09-17 17:07 1371次阅读
    能源数字化转型核心!一张图揭秘绿电直连“<b class='flag-5'>五</b>流合一”超级架构

    NetApp助力对象存储现代化,提升速度、可扩展性和安全性

    智能数据基础设施公司NetApp® (NASDAQ: NTAP) 今天宣布推出NetApp StorageGRID® 12.0,这是一款可扩展的软件定义对象存储解决方案,专为非结构化数据而设
    的头像 发表于 09-11 10:41 726次阅读

    canopen如何通过对象字典控制外设?

    各位大佬好,我在移植canopen的时候碰到一疑问。比如我修改对象字典2000,子索引为0这个目录下的值,如何这个对象映射的是某个led灯的亮灭,输入1为亮,0为灭。 问题就是我发送报文之后会进入
    发表于 09-11 06:04

    易华录荣获2025国信息协会数据要素应用创新大赛奖项

    近日,2025国信息协会数据要素应用创新大赛在北京圆满举行,易华录的“易资大模型”和“天津津南PPP项目-政务数据一体化服务底座”两项目,经过多轮遴选和专家评审,分别荣获二等奖、商业价值奖。
    的头像 发表于 09-08 18:20 2259次阅读

    影响保护元器件的可靠性以及保护响应时间的关键要素有哪些?

    影响保护元器件的可靠性以及保护响应时间的关键要素
    发表于 09-08 06:45

    PCBA加工锡膏选型的“维评估法”

    在PCBA加工,锡膏选型是决定焊接质量、可靠性和生产效率的关键环节。“维评估法”是一种系统化、结构化的选型方法,它从合金成分与性能、工艺适应性、焊接可靠性、兼容性与适用性、成本效益
    的头像 发表于 08-06 09:14 1295次阅读
    PCBA加工<b class='flag-5'>中</b>锡膏选型的“<b class='flag-5'>五</b>维评估法”

    存储示波器的存储深度对信号分析有什么影响?

    存储深度(Memory Depth)是数字示波器的核心参数之一,它直接决定了示波器在单次采集过程能够记录的采样点数量。存储深度对信号分析的影响贯穿时域细节捕捉、频域分析精度、触发稳定性等多个维度
    发表于 05-27 14:39