0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何快速认识Ceph/CephFS,最简单的方式就是快速应用它

倩倩 来源:lq 作者:SandaG 2019-09-20 11:33 次阅读

大数据需要大存储,尤其是文件存储,Hadoop组件之一HDFS也因此得到了快速发展。随着AI时代的来临,机器学习对于大存储提出了更高的要求。 分布式、并行、高速、在线扩展、高可用、可靠、安全等等,现代机器学习尤其是深度学习,要做大模型和超大模型训练,要迭代数以TB级别甚至PB级别的样本,要做类似spark的checkpoint,要做动态感知计算和网络环境的调度,等等复杂负载,对文件系统的这些需求逐渐都变成了刚需。

当前比较流行的分布式文件系统,包括HDFS、Ceph/CephFS、Lustre、GPFS、GlusterFS等,各具特点,并应用于一些特定的场景。作为开源项目的佼佼者,Ceph/CephFS因提供了对象存储、块存储、文件系统三种接口,得到了最为广泛的应用。常规的场景中,对象存储可以搭建企业级网盘,块存储可以作为OpenStack/KVM的镜像后端,文件存储可以替代HDFS支持大数据。 在云原生大行其道的今天,Ceph也没有落后脚步。目前已经提供了Kubernetes/Docker存储的原生支持。

了解Ceph的人,大都会认为Ceph是一个相对复杂的系统,尤其当磁盘规模达到千块甚至万块时。Ceph经受住了长时间的应用考验,也说明其架构设计非常之优秀。

在OPPO的机器学习平台里,Ceph也在发挥着极其重要的作用,提供了诸如深度模型 分布式训练、 代码 和 数据共享 、 训练任务容灾 、 模型急速发布 等能力。Ceph的应用场景远不仅如此,但因为Ceph系统太过“复杂”,导致很多架构师或者技术经理不敢轻易触碰。

诚然,采纳和应用一门新技术,向来不是一个简单容易的过程,但认识或者理解一门新技术,对于我们这些混迹于IT和互联网圈的同学,可能从来都不是什么难事儿。

如何快速认识Ceph/CephFS,最简单的方式就是快速应用它 。 如果想要理解它的原理,看代码便是最直接的方式。后面,我们用源码构建并运行一个小型的Ceph,全面感知下Ceph的魅力。对于了解Docker的同学,可以在容器里进行这个尝试。

以下演示如何快速编译并启动一个 管理三块磁盘的 分布式文件系统 。图中Rados Cluster即为构造的Ceph存储集群, CephFS Kernel Client 是实现Linux VFS标准的内核模块,两者通过网络传递磁盘IO。

准备阶段

假设物理机ip为10.13.33.36,新启的容器ip为10.244.0.5

第一步: 准备好编译和运行的操作系统容器

第二步: 在容器内安装编译和运行Ceph的环境依赖库

第三步: 下载Ceph源代码并解压进入代码工程目录

第四步: 依赖准备

第五步: 编译Ceph

第六步: 启动Ceph集群并检查Ceph Cluster状态

第七步:客户端挂载CephFS文件系统

第八步: 客户端检测并使用CephFS文件系统

通过以上简单操作,即使是在未能熟悉mon/mds/osd服务功能,不用了解CRUSH算法原理,不懂cmake和make编译系统的情况下, 也可以快速体验到一个原生的Ceph/CephFS。

上述的Ceph集群虚拟管理了三块disk(filesystem),并通过CephFS接口暴露文件系统接口,客户端主机通过挂载该CephFS到/tmp/oppofs目录,所有读写/tmp/oppofs目录和文件的IO都会通过网络传递给Ceph Rados Cluster,并分发给三块disk。

当disk分布在多个主机时,在不同主机配置并启动相对应的OSD进程即可,每块磁盘的IO都是通过OSD进程进行管理。对Ceph性能和功能有特殊需求的场景,也可以通过直接调整源代码来定制。

Ceph本身具备的能力足以支撑起成千上万块磁盘,但因磁盘数量高速增长引来的其他相关挑战,就需要各位实践者去不断学习和积累相关的知识去应对了。 Ceph作为领先的大数据存储解决方案 , 应用场景将会越来越丰富 。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 磁盘
    +关注

    关注

    1

    文章

    336

    浏览量

    24872
  • 机器学习
    +关注

    关注

    66

    文章

    8088

    浏览量

    130509
  • 大数据
    +关注

    关注

    64

    文章

    8623

    浏览量

    136566
收藏 人收藏

    评论

    相关推荐

    简单认识变压器

    简单认识变压器
    的头像 发表于 01-25 10:05 338次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>变压器

    请问怎样使用cephadm部署ceph集群呢?

    从红帽ceph5开始使用cephadm代替之前的ceph-ansible作为管理整个集群生命周期的工具,包括部署,管理,监控。
    的头像 发表于 01-16 09:32 316次阅读
    请问怎样使用cephadm部署<b class='flag-5'>ceph</b>集群呢?

    快速入门BlueNRG SDK固件开发流程

    本文档指导用户快速地对 BlueNRG SDK 有一个直观、清晰的认识,了解其软件架构,以便顺利地学会利用 SDK 开发自己的用户固件。
    的头像 发表于 01-13 10:43 1058次阅读
    <b class='flag-5'>快速</b>入门BlueNRG SDK固件开发流程

    简单认识无源器件

    简单认识无源器件
    的头像 发表于 01-12 09:56 236次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>无源器件

    直流高压发生器实现快速极性转换的几种方式

    直流高压发生器实现快速极性转换的几种方式  直流高压发生器是一种能够输出高电压、高稳定性的设备,广泛应用于实验室研究、工业生产以及医疗领域等。在某些应用场景中,可能需要快速地实现极性转换,即将正极
    的头像 发表于 12-20 15:23 374次阅读

    如何用“搭积木“方式快速搭建智慧工厂大屏

    传统的工厂管理方式里,管理层缺乏一个可视化的工具来实现对工厂生产的整体管理。通过ZWS云低代码平台,可以使用“搭积木“的方式快速搭建出一个智慧工厂可视化大屏,实现工厂管理的实时高效。ZWS云低代码
    的头像 发表于 12-06 08:24 182次阅读
    如何用“搭积木“<b class='flag-5'>方式</b><b class='flag-5'>快速</b>搭建智慧工厂大屏

    基于快速傅里叶变换的快速算法

    电子发烧友网站提供《基于快速傅里叶变换的快速算法.pdf》资料免费下载
    发表于 11-06 10:25 1次下载
    基于<b class='flag-5'>快速</b>傅里叶变换的<b class='flag-5'>快速</b>算法

    Verilog设计快速入门秘籍

    Verilog设计快速入门秘籍,拿走不谢!
    发表于 11-03 12:00

    快速上手micro ros在RT-Thread上

    快速上手micro ros && RT-Thread(serial和udp方式
    的头像 发表于 10-26 16:13 368次阅读
    <b class='flag-5'>快速</b>上手micro ros在RT-Thread上

    AT32 IDE快速入门指南

    AT32 IDE 快速入门指南帮助用户快速熟悉Artery AT32 IDE的简明指南。
    发表于 10-26 06:13

    基于快速傅里叶变换的并行码相位快速捕获技术研究

    电子发烧友网站提供《基于快速傅里叶变换的并行码相位快速捕获技术研究.pdf》资料免费下载
    发表于 10-24 11:28 0次下载
    基于<b class='flag-5'>快速</b>傅里叶变换的并行码相位<b class='flag-5'>快速</b>捕获技术研究

    HarmonyOS/OpenHarmony应用开发-DevEco Studio帮助快速入门的使用

    DevEco Studio内置有帮助中心,初学HarmonyOS 及OpenHarmony应用、元服务的开发者,通过内置的帮助中去系统的学习相关内容,是边练边学,快速上手的最佳方式。 一、帮助 二
    发表于 09-13 16:28

    简单介绍快速温变试验箱的使用步骤

    快速温变试验箱适用于航空航天产品、信息电子仪器仪表、材料、电工、电子产品、各种电子元气件在高温低温快速变化的环境下、检验其各性能项指标。以下是快速温变试验箱的使用步骤:1.摆放位置:快速
    的头像 发表于 09-08 11:34 498次阅读
    <b class='flag-5'>简单</b>介绍<b class='flag-5'>快速</b>温变试验箱的使用步骤

    SDNLAB技术分享:Ceph在云英的实践

    RBD,对象存储RADOSGW和CephFS三种,基本覆盖了绝大部分企业对存储的需求,所以越来越多企业加入到使用Ceph的行列。在国内也有越来越多的个人和企业参与到Ceph的研发中,贡献自己的力量。
    发表于 06-16 09:32 247次阅读
    SDNLAB技术分享:<b class='flag-5'>Ceph</b>在云英的实践

    简单认识一下EMC中共模和差模的区别

    电压电流的变化通过导线传输时有两种形态, 即共模和差模。下面带大家简单认识一下共模和差模的区别。
    发表于 06-08 14:58 2667次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>一下EMC中共模和差模的区别