0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

做Docker Image的一些技巧

马哥Linux运维 来源:马哥Linux运维 作者:马哥Linux运维 2022-07-22 10:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近做了一个好玩的工具,叫xbin.io[1]。其中有一项工作是为不同的工具来构建 Docker 镜像,让他们都运行在 Docker 中(实际上,是兼容 Docker image 的其他 sandbox 系统,没有直接用 Docker)。支持的工具越来越多,为了节省资源,Build 的 Docker image 就越小越好,文件越少,其实启动速度也会略微快一些,也会更安全一些。

这篇文章来介绍一下做 Docker Image 的一些技巧。

在之前的博客Docker (容器) 的原理[2]中介绍过 Docker image 是如何工作的。简单来说,就是使用 Linux 的overlayfs[3], overlay file system 可以做到,将两个 file system merge 在一起,下层的文件系统只读,上层的文件系统可写。如果你读,找到上层就读上层的,否则的话就找到下层的给你读。然后写的话会写入到上层。这样,其实对于最终用户来说,可以认为只有一个 merge 之后的文件系统,用起来和普通文件系统没有什么区别。

有了这个功能,Docker 运行的时候,从最下层的文件系统开始,merge 两层,得到新的 fs 然后再 merge 上一层,然后再 merge 最上一层,最后得到最终的 directory,然后用chroot[4]改变进程的 root 目录,启动 container。

654c381a-05da-11ed-ba43-dac502259ad0.png

了解了原理之后,你会发现,这种设计对于 Docker 来说非常合适:

如果 2 个 image 都是基于 Ubuntu,那么两个 Image 可以共用 Ubuntu 的 base image,只需要存储一份;

如果 pull 新的 image,某一层如果已经存在,那么这一层之前的内容其实就不需要 pull 了;

后面 build image 的技巧其实都是基于这两点。

另外稍微提一下,Docker image其实就是一个 tar 包[5]。一般来说我们通过Dockerfile用docker built命令来构建,但是其实也可以用其他工具构建,只要构建出来的image 符合 Docker 的规范[6],就可以运行。比如,之前的博文Build 一个最小的 Redis Docker Image[7]就是用 Nix 构建出来的。

技巧1:删除缓存

一般的包管理器,比如apt,pip等,下载包的时候,都会下载缓存,下次安装同一个包的时候不必从网络上下载,直接使用缓存即可。

但是在 Docker Image 中,我们是不需要这些缓存的。所以我们在Dockerfile中下载东西一般会使用这种命令:

RUNdnfinstall-y--setopt=tsflags=nodocs
httpdvim&&
systemctlenablehttpd&&
dnfcleanall

在包安装好之后,去删除缓存。

一个常见的错误是,有人会这么写:

FROMfedora
RUNdnfinstall-ymariadb
RUNdnfinstall-ywordpress
RUNdnfcleanall

Dockerfile 里面的每一个RUN都会创建一层新的 layer,如上所说,这样其实是创建了 3 层 layer,前 2 层带来了缓存,第三层删除了缓存。如同 git 一样,你在一个新的 commit 里面删除了之前的文件,其实文件还是在 git 历史中的,最终的 docker image 其实没有减少。

但是 Docker 有了一个新的功能,docker build --squash。squash 功能会在 Docker 完成构建之后,将所有的 layers 压缩成一个 layer,也就是说,最终构建出来的 Docker image 只有一层。所以,如上在多个RUN中写 clean 命令,其实也可以。我不太喜欢这种方式,因为前文提到的,多个 image 共享 base image 以及加速 pull 的 feature 其实就用不到了。

一些常见的包管理器删除缓存的方法:

yum yum clean all
dnf dnf clean all
rvm rvm cleanup all
gem gem cleanup
cpan rm -rf ~/.cpan/{build,sources}/*
pip rm -rf ~/.cache/pip/*
apt-get apt-get clean

另外,上面这个命令其实还有一个缺点。因为我们在同一个RUN中写多行,不容易看出这个dnf到底安装了什么。而且,第一行和最后一行不一样,如果修改,diff 看到的会是两行内容,很不友好,容易出错。

可以写成这种形式,比较清晰。

RUNtrue
&&dnfinstall-y--setopt=tsflags=nodocs
httpdvim
&&systemctlenablehttpd
&&dnfcleanall
&&true

技巧2:改动不频繁的内容往前放

通过前文介绍过的原理,可以知道,对于一个 Docker image 有 ABCD 四层,B 修改了,那么 BCD 会改变。

根据这个原理,我们在构建的时候可以将系统依赖往前写,因为像apt,dnf这些安装的东西,是很少修改的。然后写应用的库依赖,比如pip install,最后 copy 应用。

比如下面这个 Dockerfile,就会在每次代码改变的时候都重新 Build 大部分 layers,即使只改了一个网页的标题。

FROMpython:3.7-buster

#copysource
RUNmkdir-p/opt/app
COPYmyapp/opt/app/myapp/
WORKDIR/opt/app

#installdependenciesnginx
RUNapt-getupdate&&apt-getinstallnginx
RUNpipinstall-rrequirements.txt
RUNchown-Rwww-data:www-data/opt/app

#startserver
EXPOSE8020
STOPSIGNALSIGTERM
CMD["/opt/app/start-server.sh"]

我们可以改成,先安装 Nginx,再单独 copyrequirements.txt,然后安装pip依赖,最后 copy 应用代码。

FROMpython:3.7-buster

#installdependenciesnginx
RUNapt-getupdate&&apt-getinstallnginx
COPYmyapp/requirements.txt/opt/app/myapp/requirements.txt
RUNpipinstall-rrequirements.txt

#copysource
RUNmkdir-p/opt/app
COPYmyapp/opt/app/myapp/
WORKDIR/opt/app

RUNchown-Rwww-data:www-data/opt/app

#startserver
EXPOSE8020
STOPSIGNALSIGTERM
CMD["/opt/app/start-server.sh"]

技巧3:构建和运行 Image 分离

我们在编译应用的时候需要很多构建工具,比如 gcc, golang 等。但是在运行的时候不需要。在构建完成之后,去删除那些构建工具是很麻烦的。

我们可以这样:使用一个 Docker 作为 builder,安装所有的构建依赖,进行构建,构建完成后,重新选择一个 Base image,然后将构建的产物复制到新的 base image,这样,最终的 image 只含有运行需要的东西。

比如,这是安装一个 golang 应用pup的代码:

FROMgolangasbuild
ENVCGO_ENABLED0
RUNgoinstallgithub.com/ericchiang/pup@latest

FROMalpine:3.15.4asrun
COPY--from=build/go/bin/pup/usr/local/bin/pup

我们使用golang这个 1G 多大的 image 来安装,安装完成之后将 binary 复制到 alpine, 最终的产物只有 10M 左右。这种方法特别适合一些静态编译的编程语言,比如 golang 和 rust.

技巧4:检查构建产物

这是最有用的一个技巧了。

dive 是一个 TUI,命令行的交互式 App,它可以让你看到 docker 每一层里面都有什么。

dive ubuntu:latest命令可以看到 ubuntu image 里面都有什么文件。内容会显示为两侧,左边显示每一层的信息,右边显示当前层(会包含之前的所有层)的文件内容,本层新添加的文件会用黄色来显示。通过tab键可以切换左右的操作。

656e6296-05da-11ed-ba43-dac502259ad0.png

一个非常有用的功能是,按下ctrl+U可以只显示当前层相比于前一层增加的内容,这样,就可以看到增加的文件是否是预期的了。

按ctrl+Space可以折叠起来所有的目录,然后交互式地打开他们查看,就像是 Docker 中的ncdu。

审核编辑:彭静

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 镜像
    +关注

    关注

    0

    文章

    178

    浏览量

    11548
  • root
    +关注

    关注

    1

    文章

    86

    浏览量

    22007
  • Docker
    +关注

    关注

    0

    文章

    526

    浏览量

    14025

原文标题:4 个超实用的 Docker 镜像构建技巧

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    docker无法启用怎么解决?

    mengxing@mengxing-virtual-machine:/etc/docker$ sudo systemctl daemon-reload
    发表于 06-23 07:17

    Docker Volume管理命令大全

    Docker Volume管理命令大全
    的头像 发表于 05-28 17:14 613次阅读

    如何使用Docker部署大模型

    随着深度学习和大模型的快速发展,如何高效地部署这些模型成为了个重要的挑战。Docker 作为种轻量级的容器化技术,能够将模型及其依赖环境打包成个可移植的容器,极大地简化了部署流程
    的头像 发表于 05-24 16:39 801次阅读

    Debian和Ubuntu哪个好一些

    兼容性对比Debian和Ubuntu哪个好一些,并为您揭示如何通过RAKsmart服务器释放Linux系统的最大潜能。
    的头像 发表于 05-07 10:58 855次阅读

    在FX2LP USB上配置GPIF中断时遇到一些问题,求解决

    你好,我在 FX2LP USB 上配置 GPIF 中断时遇到一些问题。 我启用了 INT4 中断并从 GPIF 中选择了源 INT4,然后启用了 GPIF 完成中断,但我看不到中断 4 工作。 我该如何呢?
    发表于 05-06 08:00

    Docker Compose的常用命令

    大家好,今天给大家分享Docker Compose的常用命令,以及docker-compose文件的属性。Docker Compose 是个用于定义和运行多容器
    的头像 发表于 04-30 13:40 931次阅读

    如何添加一些网络上的库到mpy固件的说明或手册教程?

    下有没有关于如何添加一些网络上的库到mpy固件的说明或手册教程? 问题2: 关于mpy的image库在哪里能了解学习内部代码,只了解一些python,想知道怎么从c转换成mpy能调用的,自己写的c也能转成py调用
    发表于 04-29 08:16

    Docker常用命令大全

    Docker种开源的应用容器引擎,广泛应用于开发、部署和运行分布式应用。掌握 Docker 常用命令对于开发人员和运维人员来说非常重要。本文将为大家整理常用的Docker 命令,
    的头像 发表于 04-22 12:47 674次阅读

    基于RV1126开发板的板卡Docker环境部署方法

    自动化脚本可以创建Image。        Dockerfile:中文名叫镜像描述文件,是个包含用于组合镜像目录的文本文档,也可以叫“脚本”。用户通过docker build命令,读取
    的头像 发表于 04-16 10:04 489次阅读
    基于RV1126开发板的板卡<b class='flag-5'>Docker</b>环境部署方法

    【技术案例】Android in Docker

    Docker介绍Docker个开源的容器化平台,用于打包、分发和运行应用程序。它通过将应用及其所有依赖打包到独立的容器中,确保应用在不同环境中致运行。
    的头像 发表于 04-02 16:33 1456次阅读
    【技术案例】Android in <b class='flag-5'>Docker</b>

    基于Docker镜像逆向生成Dockerfile

    在本文中, 我们将通过理解Docker镜像如何存储数据, 以及如何使用工具查看镜像方方面面的信息来逆向工程Docker镜像; 以及如何使用Python的Docker API来构建
    的头像 发表于 03-10 09:45 1217次阅读
    基于<b class='flag-5'>Docker</b>镜像逆向生成Dockerfile

    云服务器 Flexus X 实例,Docker 集成搭建 NGINX

    Docker 集成搭建 NGINX 1、购买华为云 Flexus X 实例 Flexus云服务器X实例-华为云 (huaweicloud.com)   2、docker 安装 yum install
    的头像 发表于 01-13 11:09 1231次阅读
    云服务器 Flexus X 实例,<b class='flag-5'>Docker</b> 集成搭建 NGINX

    AN29-关于DC-DC转换器的一些想法

    电子发烧友网站提供《AN29-关于DC-DC转换器的一些想法.pdf》资料免费下载
    发表于 01-08 13:57 0次下载
    AN29-关于DC-DC转换器的<b class='flag-5'>一些</b>想法

    网站云服务器还是服务器好一些

    网站云服务器还是服务器好一些网站选择云服务器通常更好,因为它提供成本效益、高可扩展性、高可用性和便捷的管理维护,尤其适合中小企业和个人网站。虽然传统服务器在性能和数据安全上有优势,但云服务器的综合性价比和灵活性使其成为大多
    的头像 发表于 01-08 09:56 779次阅读

    docker的基本命令和使用示例

    DotCloud 公司是家 PAAS 服务提供商,从 docker 的出身也可以看出它的主要功能和方向。
    的头像 发表于 01-06 15:59 781次阅读