0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云原生存储在实际场景中可以做什么

汽车玩家 来源:阿里云云栖号 作者:阿里云云栖号 2020-04-04 16:53 次阅读

引言

随着云原生应用对可迁移性、扩展性和动态特性的需求,对云原生存储也带来了相应的密度、速度、混合度的要求,所以对云存储基本能力之上又提出了在效率、弹性、自治、稳定、应用低耦合、GuestOS 优化和安全等方面的诉求。

新的企业负载/智能工作负载容器化、迁云、存储方面遇到的性能、弹性、高可用、加密、隔离、可观测性及生命周期等方面的问题,不但需要存储产品层次的改进,还需要在云原生的控制/数据平面的改进,推进云原生存储和云存储的演进。下文将分别介绍一下问题场景及问题,探讨可行的解决方案,最终可以得出云原生存储、云存储目前可以做什么和未来还需要做什么。

存储性能

1. 长时延增加

场景

高性能计算场景中,集中处理批量数据,通过容器集群,同时启动数千 Pod,弹出数百 ECS 对共享性文件系统读写。

问题

重负载终负载下时延增加,高延迟毛刺增多,读写稳定性不足。

云原生存储在实际场景中可以做什么

解决方案

分散负载到多文件系统,通过容器编排分散 IO 到多文件系统

存储产品的盘古 2.0 改造

2. 集中式高吞吐写对共享存储池冲击

场景

高性能计算场景中,集中处理批量数据,10Gbps 读写请求进入同一存储集群。

问题

同一存储集群中的带宽挤占,造成访问质量下降。

云原生存储在实际场景中可以做什么

解决方案

分散负载到多文件系统和多个存储集群/多个可用区,通过容器编排分散 IO 到多文件系统;

使用独占高性能并行文件系统。

**3. 峰值吞吐不足**

场景

大规模生物数据处理,文件数目少,峰值吞吐高 10Gbps-30Gbps,请求密集 1W/s。

问题

接近独占集群的极限带宽。

云原生存储在实际场景中可以做什么

解决方案

读写分流,分流读请求到 OSS,写请求负载分流到独占文件系统和本地/远程块存储,通过容器编排分散 IO 到多文件系统;

使用应用层分布式缓存降低网络读 IO;

存储产品的盘古 2.0 改造。

时延增加导致 GPU 等待

场景

多机多卡 GPU 训练,直接读取 OSS 数据,读密集型。

问题

时延增加导致 IOwait 和 GPU 等待。

云原生存储在实际场景中可以做什么

解决方案

应用层透明 POSIX 读访问 OSS;

使用应用层分布式缓存降低网络读 IO。

存储弹性

场景

数据库扩容, MySQL and etc;元数据管理应用在线扩容 Zookeeper/etcd;本地盘存储容量无法扩容。

解决方案

云盘在线扩容,应用控制面文件系统/逻辑卷离线,在线扩容能力;

单机云盘挂载密度;

存储产品 ESSD 的替换使用。

存储高可用

场景

应用运维,系统运维;块存储随容器迁移的稳定性和可发现性。

解决方案

控制平面声明式存储快照,备份,定时快照备份,本地快照加速备份和恢复;控制平面云盘 SerialNum 的可发现性改造。

存储的加密

场景

用户应用的全链路数据加密需求;操作系统盘加密。

解决方案

产品存储的 CMK,BYOK 支持控制平面的加密声明支持RAM 权限的最小化控制

存储的隔离性

场景

单盘多应用共享,单机日志盘块存储切分

单块本地盘/云盘吞吐能力不足

文件系统多租户环境的容量配额

集群级文件系统共享访问的权限控制

解决方案

控制面 LVM 切分,控制面块存储 blkio buffer IO 应用级限速

控制面 LVM 多盘聚合和条带

存储产品共享文件系统的目录级 Quota

控制面文件系统的目录级 ACL

存储的可观测性

场景

多租户 Zookeeper/etcd,租户/应用级的 IO 指标监控和预警。

解决方案

控制面应用级 IO Metrics 采集能力

控制面设备级 IO Metrics 采集能力

控制面挂载点级 IO Metrics 采集能力

存储的生命周期

场景

共享文件系统/缓存系统的声明式创建和删除。

解决方案

Operator: 云盘/本地盘 (TiDB)

Operator: 文件系统,CPFS

Operator: 对象存储

云原生存储 v2

针对以上在新的计算模式下,存储方面遇到的性能,弹性,高可用,加密,隔离,可观测性,生命周期等方面的问题,不但是需要存储产品层次的改进,更需要在云原生的控制/数据平面的改进,在不久的将来实现稳定,安全,自治,和效率并举的云原生存储 v2。

稳定:阿里云存储的全品类支持可观测性, Flexvolume and CSI plugins/IO metrics (CSI for 1.14);安全:全连路数据存储的可靠/可信存储支持,CSI 快照加密,系统盘加密;自治:云盘快照 /本地快照 ,离线在线的存储扩容能力, 元数据自动发现;效率:I/O 隔离 、可伸缩性/云盘再次分割提升密度/分布式存储缓存。

云原生存储在实际场景中可以做什么

需要在云原生应用层、存储云产品层、底层存储适配和存储核心层都需要做相应的改进和提升才有可能提供更加稳定,安全,自治和高效的面向应用的云原生存储。

云原生存储在实际场景中可以做什么

总结

云原生存储是云存储 UI 和效率等能力的集合;分层存储,不重新发明轮子;新的工作负载推进云原生存储和云存储的演进,云原生控制平面实现效率,自治方面能力,从数据面提升存储稳定和减小安全隐患,云存储继续夯实性能,容量,弹性,密度等基础能力,共建云原生环境下的存储生态。

在云原生存储 v2 的演进过程中,仍然需要容器团队和存储团队,通力合作,共同提升的云原生时代的存储能力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126672
  • 云存储
    +关注

    关注

    7

    文章

    714

    浏览量

    45826
收藏 人收藏

    评论

    相关推荐

    云原生是大模型“降本增效”的解药吗?

    云原生AI正当时
    的头像 发表于 02-20 09:31 132次阅读

    米哈游大数据云原生实践

    近年来,容器、微服务、Kubernetes 等各项云原生技术的日渐成熟,越来越多的公司开始选择拥抱云原生,并开始将 AI、大数据等类型的企业应用部署运行在云原生之上。以 Spark 为例,在云上运行
    的头像 发表于 01-09 10:41 262次阅读
    米哈游大数据<b class='flag-5'>云原生</b>实践

    云原生技术前沿落地实践分论坛圆满举办

    12 月 16 日,2023 开放原子开发者大会【云原生技术前沿落地实践】分论坛在无锡成功举办。论坛将聚焦云原生的泛在化、Serverless 化以及智能化等前沿发展趋势,与一线技术专家及最终用户
    的头像 发表于 12-22 09:20 562次阅读
    <b class='flag-5'>云原生</b>技术前沿落地实践分论坛圆满举办

    云原生数据库GaiaDB架构设计解析

    目前,云原生数据库已经被各行各业大规模投入到实际生产中,最终的目标都是「单机 + 分布式一体化」。但在演进路线上,当前主要有两个略有不同的路径。
    的头像 发表于 12-14 14:48 211次阅读
    <b class='flag-5'>云原生</b>数据库GaiaDB架构设计解析

    诚邀报名|在开发者大会,洞悉云原生技术落地最佳实践

    2023开放原子开发者大会 . OPENATOM DEVELOPERS CONFERENCE 云原生技术前沿落地实践分论坛 2023.12.16 随着云原生技术的蓬勃发展,云原生已成为企业数字化转型
    的头像 发表于 12-09 18:45 416次阅读

    ABI发布电信云原生平台及运维白皮书

    近日,由Informa Tech主办的5G核心网峰会在伊斯坦布尔举行。ABI Research高级分析师 Don Alusha在峰会上发布了《云原生平台和管理趋势:标准和容器展望》白皮书。该白皮书
    的头像 发表于 11-17 19:40 315次阅读
    ABI发布电信<b class='flag-5'>云原生</b>平台及运维白皮书

    华为马亮:迈向电信云原生3.0,兑现云化价值

    特征,并呼吁产业界共同携手,迈向电信云原生3.0,兑现云化价值。 马亮发表主题演讲 云原生理念源于IT实践,但产业界针对云 原生在不同场景下的理解并不统一。 基于通用的弹性、敏捷、高可
    的头像 发表于 11-16 21:50 402次阅读

    一图读懂英特尔云原生开源技术

    作为KubeCon China 2023 大会的钻石赞助商,9月26日-28日,英特尔在现场会有一个大的技术展示厅,其中包含10个现场展示,涵盖云原生基础设施,安全,人工智能以及可持续计算等。 欢迎
    的头像 发表于 09-23 10:10 383次阅读
    一图读懂英特尔<b class='flag-5'>云原生</b>开源技术

    中国移动网络云原生演进技术白皮书

    云原生是近几年云计算领域炙手可热的话题。目前,无论互联网企业还是传统企业,都在拥抱云原生云原生是包含系列技术体系、系统设计理念、组织管理方法的全面系统变革,其核心要素包含基础设施云原生
    发表于 08-30 12:15 433次阅读
    中国移动网络<b class='flag-5'>云原生</b>演进技术白皮书

    华为携手中国移动荣获“2023年度云原生技术创新领航者-云原生技术创新案例”大奖

    近日,由工业和信息化部主办、中国信息通信研究院和中国邮电器材集团有限公司承办的“ICT中国·2023高层论坛-云原生产业发展论坛”在北京国家会议中心隆重召开。在本次论坛上,中国移动联合华为技术
    的头像 发表于 07-06 18:50 382次阅读

    华为云发布面向消费终端的企业云原生白皮书,开辟移动时代的云原生路径

    云原生路径何处寻?答案在华为云与华为终端云的牵手中
    的头像 发表于 06-06 17:38 669次阅读
    华为云发布面向消费终端的企业<b class='flag-5'>云原生</b>白皮书,开辟移动时代的<b class='flag-5'>云原生</b>路径

    探索云原生技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会云原生分论坛即将启幕

    随着开源成为软件技术创新和协同发展的重要模式,企业对云原生的认知日益强化,越来越多的企业应用云原生技术与产品解决实际问题,云原生进入落地爆发的关键期。IDC报告显示,2023年企业
    的头像 发表于 06-01 14:48 315次阅读
    探索<b class='flag-5'>云原生</b>技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会<b class='flag-5'>云原生</b>分论坛即将启幕

    探索云原生技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会云原生分论坛即将启幕

    随着开源成为软件技术创新和协同发展的重要模式,企业对云原生的认知日益强化,越来越多的企业应用云原生技术与产品解决实际问题,云原生进入落地爆发的关键期。IDC报告显示,2023年企业
    的头像 发表于 05-30 01:40 374次阅读
    探索<b class='flag-5'>云原生</b>技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会<b class='flag-5'>云原生</b>分论坛即将启幕

    RISC-V入云!赛昉科技联合中国电信完成首个RISC-V云原生轻量级虚拟机验证

    近日, 中国电信研究院成功研发业界首个支持RISC-V的云原生轻量级虚拟机TeleVM,并联合赛昉科技高性能RISC-V CPU IP——昉·天枢上完成了软硬件协同测试验证。 测试结果显示,相对于
    发表于 05-11 14:08

    中国电信自研 RISC-V 云原生轻量级虚拟机 TeleVM 成功运行,内存开销降低约 90%

    精简指令集特性,裁剪冗余功能,实现了应用安全隔离,同时降低资源消耗并提升响应速度,适用于可信云原生、Serverless、函数计算等新型弹性云计算业务场景。” 赛昉科技表示,已交付支持虚拟化指令扩展
    发表于 05-05 09:46