Docker 底层原理(二)镜像

Administrator
Administrator
发布于 2024-01-04 / 44 阅读
0
0

Docker 底层原理(二)镜像

一、镜像概述

Docker 镜像包含运行应用程序所需的所有内容:代码、运行时、库、环境变量和配置文件。镜像是构建 Docker 容器的蓝图。它们是分层的,每一层都代表一个镜像构建的指令。当你创建一个新的镜像时,你会在一个基础镜像之上添加一个新的层,这个基础镜像可能是一个操作系统(如 Ubuntu 或 CentOS),也可能是另一个已经包含了额外组件的镜像。每当你在镜像上执行一个操作(如安装软件包或修改文件),Docker 都会在镜像的顶部添加一个新的层

二、镜像核心技术——联合文件系统 Union File System

联合文件系统允许多个不同的文件系统被叠加在一起,形成单个文件系统。每一层都可以添加变更,而不影响其他层。广泛应用于 Linux 发行版中的 Live CD、Docker 镜像等场景。常见的联合文件系统有 AUFS、OverlayFS、Btrfs 等

联合文件系统的原理是将多个目录(称为分支)叠加在一起,这样就可以合并它们的内容。用户在访问文件或目录时,实际上是在访问一个由这些分支叠加而成的统一视图。下面是一些关键特点和工作原理:

  • 分层结构:在 UnionFS 中,每个分支都可以看作是一个层,层与层之间可以是只读或者可写的。这些层从下往上叠加,形成一个统一的文件系统。最下面的层通常是只读的,而最上面的层是可写的

  • 只读和可写层:只读层包含不变的数据,而可写层通常用于存储变更。这种结构使得基础数据(只读层)在多个应用中被重复利用,而不需要复制,从而节省空间

  • Copy-On-Write(COW):这是 UnionFS 的一种核心策略。当需要对文件进行修改时,如果该文件处于只读层,则首先会将该文件复制到最上面的可写层,然后再进行修改。这个过程称为“写时复制”,意味着只有在需要修改时,文件的副本才会被创建

  • 文件和目录的合并视图:从用户的角度来看,叠加在一起的所有层就像是一个普通的文件系统。如果多个层中包含了相同的文件或目录,UnionFS 按照一定的优先级规则(通常是最上面的层优先)来决定哪个版本对用户可见

  • 删除和修改:当删除或修改一个文件时,UnionFS 会在可写层创建一个特殊的标记(白板或删除标记),表示该文件在这个层被删除或修改了。即使底层的只读分支中仍然存在这个文件的原始版本,用户也看不到

  • 透明性:对于最终用户和应用程序来说,UnionFS 提供了一个透明的文件系统接口,使得它们无需关心底层的分层和叠加细节

三、镜像核心技术——写时复制 Copy On Write

一种优化策略,用于在容器中管理文件系统的写入操作

基本原理

  1. 初始状态: 当容器启动时,文件系统的各个层次被堆叠在一起,形成一个联合文件系统。这些层次中的每一个层都是只读的

  2. 写操作触发: 当容器需要对文件系统进行写操作时,例如创建、修改或删除文件,"Copy-On-Write"被触发

  3. 创建副本: 联合文件系统不直接在底层文件系统上执行写操作。相反,它在顶层的可写层创建一个被写入的文件或目录的副本

  4. 仅在需要时复制: 副本的创建是按需进行的,只有在写入操作发生时才会复制相关的文件或目录。直到写入操作发生,原始文件系统层仍然是只读的

优势与好处

  1. 避免污染底层层次: "Copy-On-Write"策略确保了底层文件系统层不会被写入,因此原始镜像或者其他容器共享的底层层次不会被修改。这有助于维护原始镜像的不变性

  2. 节省存储空间: 由于只有在写入操作发生时才会创建副本,"Copy-On-Write"减少了对存储空间的需求。多个容器可以共享相同的底层层次,只需保存它们各自的修改,而不必复制整个文件系统

  3. 快速创建副本: 由于只有在需要时才复制文件,"Copy-On-Write"使得容器可以快速创建修改,而不需要复制整个文件系统,提高了性能和效率

  4. 隔离写入操作: "Copy-On-Write"确保了容器之间的文件写入操作是相互隔离的。每个容器都有自己的写入层,使得它们可以独立地对文件系统进行修改,而不会相互影响

四、镜像制作

技术

  1. Dockerfile: Docker 使用 Dockerfile 来定义和描述镜像的构建步骤。Dockerfile 是一个文本文件,包含了从基础镜像开始,逐步添加、配置和操作的指令,最终构建出一个新的镜像。

  2. 基础镜像: 基础镜像是构建其他镜像的起点,它通常包含了操作系统和基本的运行时环境。选择适当的基础镜像对于镜像的性能和大小都有影响。

  3. Docker CLI: Docker 命令行工具是与 Docker 引擎进行交互的主要方式。通过 Docker CLI,可以执行构建、运行、推送等操作,对 Docker 镜像进行管理。

  4. Docker Hub: Docker Hub 是一个中央仓库,用于存储和分享 Docker 镜像。用户可以将自己构建的镜像推送到 Docker Hub,也可以从 Docker Hub 拉取公共镜像

流程

  1. 创建 Dockerfile: 首先,通过创建一个 Dockerfile 来定义镜像的构建步骤。Dockerfile 包含了一系列指令,例如基础镜像的选择、软件的安装、配置文件的添加等

FROM base_image:tag
RUN apt-get update && apt-get install -y software
COPY local-files /app
  1. 构建镜像: 使用 docker build 命令执行 Dockerfile 中定义的构建步骤。这将会逐步执行每个指令,生成一个新的 Docker 镜像

docker build -t my_custom_image:tag .
  1. 运行容器: 可以使用 docker run 命令基于刚刚构建的镜像启动容器。在容器中,你可以测试和验证构建的应用程序或服务

docker run -it my_custom_image:tag
  1. 推送到仓库: 如果你想分享或备份你的镜像,可以使用 docker push 命令将镜像推送到 Docker Hub 或其他容器仓库

docker push my_custom_image:tag
  1. 持续集成(可选):** 对于大型项目或团队,可以考虑将 Docker 镜像的构建过程整合到持续集成(CI)流程中,确保代码变更触发自动的构建和测试

Dockerfile编写关键指令

  1. FROM: 指定基础镜像,所有其他指令都基于该镜像。

FROM ubuntu:20.04
  1. LABEL: 为镜像添加元数据,通常用于提供版本、描述等信息。

LABEL maintainer="your-name"
  1. RUN: 在镜像中执行命令,用于安装软件包、配置环境等。

RUN apt-get update && apt-get install -y software
  1. COPY: 将文件从主机复制到镜像中。

COPY local-files /app
  1. ADD: 类似于 COPY,但可以处理 URL 和解压缩 tar 文件。

ADD https://example.com/file.tar.gz /app
  1. WORKDIR: 设置工作目录,后续的相对路径都相对于该目录。

WORKDIR /app
  1. ENV: 设置环境变量。

ENV MY_VARIABLE=my-value
  1. EXPOSE: 声明容器运行时监听的网络端口。

EXPOSE 80
  1. CMD: 指定容器启动时要运行的命令。可以有多个 CMD,但只有最后一个生效。

CMD ["executable", "param1", "param2"]
  1. ENTRYPOINT: 指定容器启动时要运行的命令,与 CMD 结合使用。CMD 提供默认参数。

ENTRYPOINT ["executable", "param1", "param2"]
  1. VOLUME: 创建挂载点,用于持久化存储或与其他容器共享数据。

VOLUME /data
  1. USER: 设置运行时的用户名或 UID。

USER username
  1. ARG: 定义构建时的参数,可通过 docker build 命令传递。

ARG version=latest

五、镜像存储与分发

存储方式:

  1. 本地文件系统:

    • Docker 镜像可以直接存储在本地文件系统上。这适用于开发和测试阶段,以及在单机环境中使用。

  2. Docker Hub 和其他 Registry:

    • Docker Hub 是 Docker 官方提供的中央镜像仓库,允许用户将镜像上传至其中,并从中下载。私有仓库(如 Harbor、Amazon ECR、Azure Container Registry 等)也提供了类似的功能,适用于企业内部或有特殊需求的场景。

  3. Docker Volume:

    • Docker Volume 用于持久化存储容器数据,但也可以用来存储镜像。这种方式适用于需要在容器之间共享数据的场景,但并不是首选的镜像存储方式。

  4. 分布式存储系统:

    • 在某些场景中,可以使用分布式存储系统(如 Ceph、GlusterFS、NFS 等)来存储 Docker 镜像。这种方式允许多个 Docker 主机共享相同的存储,提供高可用性和扩展性。

分发方式:

  1. Docker Push 和 Pull:

使用 docker push 命令将本地构建的镜像上传到 Docker Hub 或其他 Registry,并使用 docker pull 命令在其他机器上下载镜像。这是最常见的分发方式。

# 将镜像推送至 Docker Hub
docker push username/repository:tag
​
# 在其他机器上拉取镜像
docker pull username/repository:tag

Docker Save 和 Load:

使用 docker save 命令将镜像保存为 tar 文件,然后通过 docker load 命令在其他机器上加载。这种方式适用于离线环境或需要手动迁移镜像的情况。

# 将镜像保存为 tar 文件
docker save -o image.tar username/repository:tag
​
# 在其他机器上加载镜像
docker load -i image.tar

导出和导入容器快照:

使用 docker export 命令导出容器快照,然后使用 docker import 命令导入为镜像。这种方式适用于将容器快照分享给其他人。

# 导出容器快照
docker export container_id > container.tar
​
# 导入为镜像
cat container.tar | docker import - username/repository:tag


评论