0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM Storage Ceph:现代数据湖仓的理想技术底座

全球TMT 来源:全球TMT 作者:全球TMT 2024-02-02 10:24 次阅读

作者:周立旸,IBM 大中华区科技事业部存储软件产品总监

北京2024年2月1日/美通社/ -- 一年前,IBM 将 Red Hat 存储产品的路线图及团队集成至 IBM存储业务(IBM Storage)。在此期间,企业在扩展 AI 时正面临前所未有的数据挑战:在多个位置、以多种形式存储的数据量飙升,但数据质量较差。为了帮助客户解决这一问题,我们需要领先的解决方案对客户的基础架构进行现代化改造,以支持其数字化转型。这主要涉及在本地和云环境中提供一致的应用和数据存储。此外,还需要帮助客户采用云原生架构,实现公有云在成本、速度和弹性等方面的优势。作为业界领先的开源软件定义存储平台,IBM Storage Ceph(前身为 Red Hat Ceph)正是实现这一目标所需的基石。

wKgaomW7rpaAGBOrAAEpanYOLGw648.jpg


周立旸,IBM 大中华区科技事业部存储软件产品总监

在数据管理方面,软件定义存储 (SDS) 已成为一股变革力量。与传统的传统存储阵列相比,它具有许多优势,包括极高的灵活性与可扩展性,这非常适用于处理生成式 AI 等最新用例。借助 IBM Storage Ceph,用户可从底层硬件中提取存储资源,实现数据存储的动态分配和高效利用。这种灵活性不仅可以简化管理流程,还有助于提高敏捷性,适应不断变化的业务需求,并将随着新工作负载的增加而扩展计算和容量。这一自我修复和自我管理的平台可在行业标准硬件上运行,并大规模地提供统一的文件存储、块存储和对象存储服务。[1]统一存储可以帮助客户将在独立文件或块存储上运行的传统应用,和包含单一设备对象存储的通用平台连接起来。

Ceph 针对大型单站点和多站点部署进行了优化,经过高效扩展可以支持数百 PB 级数据和数百亿个对象,[2]这对于传统工作负载和生成式 AI 工作负载至关重要。IBM Storage Ceph 可扩展、弹性且安全,支持更传统的工作负载,例如 Red Hat OpenShift 或 RedHat OpenStack 上的 MySQL 和 MongoDB,是支持数据湖仓和AI/ML 开源框架的理想之选。这也是 IBMwatsonx.data包含 IBM Storage Ceph 768 TiB 裸容量授权的原因之一;前者是 IBM推出的开放、可治理、定制化的数据湖仓架构,并针对数据、分析和 AI 工作负载进行了优化。

计算密集型和数据密集型工作负载的理想底座

非结构化数据的爆炸式增长和生成式 AI 相互影响,也相辅相成。Gartner 在其《2023 年企业数据存储的主要趋势》报告中指出:"到 2028 年,大型企业的本地、边缘和公有云上的非结构化数据将比 2023 年年中增加两倍。"[3]非结构化数据(如文本、图像和视频)的激增为训练生成式 AI 模型提供了广泛而多样的资源,而生成式 AI 可支持用户从非结构化数据中提前宝贵的洞察。这种协同作用形成了一个反馈循环,生成式 AI 在大量非结构化数据的基础上蓬勃发展,而 AI 持续生成的真实数据则进一步丰富和完善人们对非结构化数据集的理解,从而促进创新和进步。

根据上述报告[4],预计到 2028 年,将有 70% 的文件和对象数据部署在集成的非结构化数据存储平台上(高于 2023 年的 35%),组织需要能够加速数据提取、数据清理和分类、元数据管理和扩充、云规模容量管理和部署(如软件定义存储)的存储管理解决方案。IBM Storage Ceph 可实现无缝扩展,满足不断增长的数据需求;其自我管理功能确保系统适应不断变化的条件,轻松实现数据完整性。

为了在整个组织中加速和扩展数据和 AI,并最终改善业务成果,企业必须有意识地采用混合云设计(hybrid cloud by design)。这包括通过云原生运营模式在本地使用存储服务,以解决公有云上的部分企业级功能不可用、数据主权和成本等问题。IBM Storage Ceph 的"即插即用"架构简化了与现有基础架构的集成,包括各种平台、云环境、虚拟管理程序、开源数据存储库(如 Apache Iceberg 或 Apache Parquet)以及完整解决方案(如 watsonx.ai、watsonx.data 等)。新节点或设备可以无缝添加到集群中,而不会出现中断或服务停机。它为客户提供来一种简单高效的方式,来使用 watsonx.data 和其他新一代 AI 工作负载构建数据湖仓。

Snap Inc.相关负责人表示:"在 Snap,我们对数据存储的需求越来越大,需要一个能够快速扩展、满足性能 KPI 且具有成本效益的平台。IBM Storage Ceph 凭借其简单可扩展的架构、易于管理的界面和经济高效的软件定义部署,成为我们的首选平台。IBM Storage Ceph 还拥有 IBM 的世界级专长和支持,这也是我们决定将其引入关键业务的一个重要原因。"

利用NVMe over TCP 技术实现快速数据访问

去年,IBM 对 Ceph 进行了几项重要更新,包括最近的 IBM Storage Ceph 7.0。新一代Ceph 平台为 NVMe/TCP 功能做好了准备。它保留了传统 NVMe 的低延迟和高带宽特性,可以在存储设备、服务器和云平台之间实现更快的数据传输,因此适用于需要超快速存储访问的应用,例如数据库、分析和内容传输;并且兼容传统的网络技术投资,从而简化了基础架构。这些优势将帮助客户采用软件定义的方法,在速度、敏捷性和经济性方面享受云端体验。

NVMe/TCP 可以帮助 Ceph 通过扩展架构弥补传统块存储的不足。借助 NVMe/TCP,Ceph 将与 VMware 等平台集成,帮助企业在自己的数据中心复制云架构,摆脱昂贵且固定的 SAN 网络和单片存储阵列。

Ceph 7.0 的其他新功能:

SEC 和 FINRA 合规认证的"写一次读多次"(WORM) 对象锁定,确保对象存储符合WORM 合规要求

为非原生Ceph 客户端的 CephFS文件系统访问提供NFS 支持

如需了解该功能的更多信息,请点击此处访问IBM Storage 社区

借助IBM Storage Ceph 实现云规模经济

由于IBM Storage Ceph 将数据作为对象存储在逻辑存储池中,因此单个集群可以有多个存储池,每个存储池都将针对不同的性能或容量需求进行调整。这样一来,客户能够更轻松快速地访问各种经过分类的内容数据和上下文数据,存储容量仅受组织基础架构规模的限制;与传统存储阵列架构相比,IBM Storage Ceph可消除硬件限制,实现大规模成本降低。

加快价值实现的步伐

wKgaomW7rpeAbSwiAABEqpG3Ig0411.jpg


IBM Storage Ceph

IBM 更进一步简化了 Ceph 部署。借助IBM Storage Ready Nodesfor Ceph,该平台可部署为完整的软硬件解决方案,提供多种容量配置,针对运行 IBM Storage Ceph 工作负载进行了优化。我们消除了配置中的不确定因素,使其更易于理解、配置和管理。

IBM Storage Ceph 的发展是 IBM 存储的软硬件产品通过扩展的容量与性能,加速价值实现、优化客户成本的又一例证。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1674

    浏览量

    74275
  • AI
    AI
    +关注

    关注

    87

    文章

    26478

    浏览量

    264108
收藏 人收藏

    评论

    相关推荐

    IBM发布AI增强版FlashCore模块与新版Storage Defender软件

    IBM近日为其新一代IBM Storage FlashSystem产品系列带来了两大创新:AI增强版的IBM FlashCore模块技术,以
    的头像 发表于 03-06 10:05 245次阅读

    IBM推出AI增强的数据弹性功能,打造更安全存储解决方案

    在新一代 IBM Storage FlashSystem 产品中发布新的 AI 增强版 IBM FlashCore 模块技术,以及新版 IBM
    的头像 发表于 03-05 18:45 852次阅读

    IBM积极推进Ceph扩展,以打造AI领域的底层数据存储基石

    BM正着手扩展Ceph的块和文件存储功能,希望将其定位为Storage Scale并行文件系统之下面向AI工作负载的后端数据存储。
    发表于 02-20 16:15 139次阅读

    请问怎样使用cephadm部署ceph集群呢?

    从红帽ceph5开始使用cephadm代替之前的ceph-ansible作为管理整个集群生命周期的工具,包括部署,管理,监控。
    的头像 发表于 01-16 09:32 358次阅读
    请问怎样使用cephadm部署<b class='flag-5'>ceph</b>集群呢?

    Lambda数据架构和Kappa数据架构——构建现代数据架构

    如何更好地构建我们的数据处理架构,如何对IT系统中的遗留问题进行现代化改造并将其转变为现代数据架构?该怎么为你的需求匹配最适合的架构设计呢,本文将分析两种最流行的基于速度的数据架构,为
    的头像 发表于 11-26 08:04 278次阅读
    Lambda<b class='flag-5'>数据</b>架构和Kappa<b class='flag-5'>数据</b>架构——构建<b class='flag-5'>现代数据</b>架构

    Lambda数据架构和Kappa数据架构——构建现代数据架构

    如何更好地构建我们的数据处理架构,如何对IT系统中的遗留问题进行现代化改造并将其转变为现代数据架构?该怎么为你的需求匹配最适合的架构设计呢,本文将分析两种最流行的基于速度的数据架构,为
    的头像 发表于 11-15 13:32 263次阅读
    Lambda<b class='flag-5'>数据</b>架构和Kappa<b class='flag-5'>数据</b>架构——构建<b class='flag-5'>现代数据</b>架构

    IBM 发布新一代 IBM Storage Scale System 6000,加速释放数据和 AI 的潜力

    面向非结构化数据的全新云规模、高性能存储设备,支持最严苛的 AI 和容量密集型工作负载 近日,IBM (纽交所股票代码:IBM)  推出了全新的 IBM
    的头像 发表于 11-14 19:45 297次阅读
    <b class='flag-5'>IBM</b> 发布新一代 <b class='flag-5'>IBM</b> <b class='flag-5'>Storage</b> Scale System 6000,加速释放<b class='flag-5'>数据</b>和 AI 的潜力

    IBM推出专为AI打造的全新Storage Scale System 6000

    Storage Scale System 6000拥有高性能并行文件系统,能够从容应对数据密集型AI工作负载。它为只读工作负载提供高达700万次的IOPS(每秒输入/输出操作)和最高256 GB/秒的数据吞吐量。这样的性能水平可
    的头像 发表于 11-01 16:51 443次阅读

    Ceph分布式存储简介&amp;Ceph数据恢复流程

    Ceph存储可分为块存储,对象存储和文件存储。Ceph基于对象存储,对外提供三种存储接口,故称为统一存储。 Ceph的底层是RADOS(分布式对象存储系统),RADOS由两部分组成:OSD和MON
    的头像 发表于 09-26 15:41 442次阅读

    携手 IBM LinuxONE,共创企业级 AI 的绿色技术底座

    布的 CEO 调研报告显示,近一半的受访 CEO 将 提升生产力 视为第一要务,其次是 技术现代化、可持续性、网络安全 等;有四分之三的受访 CEO 认为,部署先进的生成式人工智能将为企业带来竞争优势。 生成式 AI 的浪潮对企业用户的算力资源、算法优化和
    的头像 发表于 08-22 19:30 277次阅读
    携手 <b class='flag-5'>IBM</b> LinuxONE,共创企业级 AI 的绿色<b class='flag-5'>技术</b><b class='flag-5'>底座</b>

    IBM Aspera Connect常见问题

    IBM Aspera采用了一种不同的方法来应对全球广域网上大数据移动的挑战。Aspera没有优化或加速数据传输,而是使用突破性的传输技术消除了潜在的瓶颈,充分利用可用的网络带宽来最大限
    发表于 08-11 06:51

    IBM推出IBM Z和云端现代化堆栈新功能,为 z/OS 和云端应用开发人员提供统一体验

    技术的互动方式。如果企业要想跟上这种发展趋势和速度,实现快速创新,那么核心业务应用的现代化不可或缺。  IBM推出IBM Z和云端现代化堆
    的头像 发表于 06-27 21:43 337次阅读

    IBM 推出 IBM Z 和云端现代化堆栈新功能,为 z/OS 和云端应用开发人员提供统一体验

    本文作者:IBM Z 应用平台副总裁 Kara Todd ‍ 人工智能、元宇宙、物联网和边缘计算等新兴技术方兴未艾,每几个月就会出现一些新功能,有望重塑人和组织与技术的互动方式。如果企业要想跟上这种
    的头像 发表于 06-27 18:10 227次阅读
    <b class='flag-5'>IBM</b> 推出 <b class='flag-5'>IBM</b> Z 和云端<b class='flag-5'>现代</b>化堆栈新功能,为 z/OS 和云端应用开发人员提供统一体验

    SDNLAB技术分享:Ceph在云英的实践

    Ceph是最近开源系统中很火的一个项目,基于Sage Weil的一片博士论文发展而来的一个分布式文件系统,可提供PB级,动态可扩展,数据安全可靠的存储服务。Ceph提供分布式存储服务包括:块存储
    发表于 06-16 09:32 261次阅读
    SDNLAB<b class='flag-5'>技术</b>分享:<b class='flag-5'>Ceph</b>在云英的实践

    为企业数据保驾护航,IBM Storage Defender 正式发布

    作者:Ram Parasuraman,IBM 存储部数据弹性业务总经理 我们很高兴地向客户和合作伙伴们宣布, IBM Storage Defender 现已正式发布,丰富了
    的头像 发表于 06-08 20:15 273次阅读
    为企业<b class='flag-5'>数据</b>保驾护航,<b class='flag-5'>IBM</b> <b class='flag-5'>Storage</b> Defender 正式发布