云栈社区»论坛 › 技术文档「 Note & Doc 」 › K8s持久化存储核心实战：Volume、PV、PVC与StorageClass配置与避 ...

5665 积分	0 好友	756 主题

发消息

K8s持久化存储核心实战：Volume、PV、PVC与StorageClass配置与避坑指南

发表于 2025-12-6 22:53:14 | 查看: 194| 回复: 0

“凌晨2点，生产环境MySQL主从切换失败，发现数据目录为空。监控显示Pod在3小时前重建过，而我们忘了配置持久卷。那一夜，我重新认识了K8s存储。”

你是否也经历过类似的困惑：

为什么应用在Docker里好好的，迁移到Kubernetes后重启一次数据就丢失？
为什么创建Pod时卡在Pending状态，提示no persistent volumes available for this claim？
PV、PVC、StorageClass的概念看了一遍又一遍，一到实战还是晕头转向？

本文将带你透彻理解Kubernetes持久化存储的核心机制，并分享生产环境中的实战经验。

一、一张图看懂K8s存储全景

在深入细节前，先通过下图理解K8s存储体系的完整流程：

[存储提供者]     │    ▼
[StorageClass] ←──┐    │            │
    ▼ (动态创建)  │
[PersistentVolume]│    ▲            │
    │ (静态预创建)│    └────────────┘
          │          ▼
[PersistentVolumeClaim]
          │          ▼
      [Pod] ───→ [Volume]

这张图揭示了两种核心供给方式：

静态供给：管理员预先创建好PV，等待PVC来匹配绑定。
动态供给：PVC通过StorageClass自动触发创建对应的PV，这是现代生产环境的主流方式。

理解这张图，就掌握了K8s存储设计的精髓。

二、四大核心概念深度解析

1. Volume（卷）：Pod的“临时记忆”

Volume是Pod级别的存储抽象，其生命周期与Pod绑定。Pod被删除，其Volume通常也会随之消亡。

apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - name: nginx
    image: nginx
    volumeMounts:
    - mountPath: "/usr/share/nginx/html"
      name: html-data
  volumes:
  - name: html-data
    emptyDir: {}  # 最简单的临时卷类型

关键点：

emptyDir、hostPath等类型的Volume不提供真正持久化，Pod重建后数据会丢失。
它们适用于临时缓存、在Pod内容器间共享数据等场景，不适合有状态应用。

2. PersistentVolume（PV）：集群的“持久记忆”

PV是集群中一块已被制备（Provision）好的网络存储资源，由管理员创建和维护，独立于任何Pod的生命周期。

apiVersion: v1
kind: PersistentVolume
metadata:
  name: pv-nfs-001
spec:
  capacity:
    storage: 100Gi
  accessModes:
    - ReadWriteOnce
  persistentVolumeReclaimPolicy: Retain # 重要！回收策略
  nfs:
    path: /data/pv1
    server: nfs-server.example.com

PV的核心属性：

capacity.storage：存储容量。
accessModes：访问模式。
persistentVolumeReclaimPolicy：回收策略（Retain/Delete/Recycle）。
存储后端类型（nfs、csi、云厂商驱动等）。

3. PersistentVolumeClaim（PVC）：用户的“存储申请单”

PVC是用户对存储资源的声明式请求。它只关心需求（如“我要10Gi可读写的存储”），而不关心具体由哪个PV或如何提供。

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: mysql-pvc
spec:
  storageClassName: nfs-storage # 指定StorageClass
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 10Gi  # 只需声明需求，无需关心底层细节

为什么需要PVC？

解耦：开发者只需声明需求，无需了解底层存储细节。
便携性：应用配置可以在不同环境（开发/测试/生产）间无缝迁移。
安全：普通用户无需直接操作集群级资源PV，只需在自己的Namespace内申请PVC。

4. StorageClass（SC）：存储的“自动售货机”

StorageClass定义了如何动态创建PV的“模板”或“类”，是现代K8s集群的标配，极大地简化了存储管理。通过云原生技术的自动化能力，它可以按需创建存储资源。

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: ssd-storage
provisioner: kubernetes.io/aws-ebs # 指定供给者（驱动）
parameters:
  type: gp3
  fsType: ext4
reclaimPolicy: Delete # PV被释放后的回收策略
allowVolumeExpansion: true  # 允许后续扩容

生产环境最佳实践：

为不同性能要求的应用创建不同的SC，例如：ssd-storage（数据库）、standard-storage（普通应用）。
设置allowVolumeExpansion: true，以应对未来可能的数据增长需求。
根据数据重要性合理配置reclaimPolicy：关键数据用Retain，临时/缓存数据可用Delete。

三、核心关系：绑定规则与生命周期

PVC与PV的绑定规则

匹配条件：
- 存储容量（PVC请求 ≤ PV容量）。
- 访问模式（必须完全匹配）。
- StorageClass名称（如果PVC指定了SC）。
- Label Selector（可选高级匹配）。
绑定过程：PVC创建后，系统会寻找满足条件的PV。若找到则静态绑定；若指定了SC且无合适PV，则触发动态创建；若都未满足，则PVC保持Pending状态。

关键生命周期场景

场景1：Pod重建，数据保留

PVC保持Bound状态。
新Pod通过引用同一个PVC，访问到原有的PV和数据。
结果：数据安全，业务无感知。

场景2：PVC删除，PV如何处理？

这取决于PV的persistentVolumeReclaimPolicy：
- Retain：PV变为Released状态，数据保留在底层存储中，需管理员手动清理。
- Delete：PV对象及底层存储（如云盘）会被一并删除（高危操作！）。
- Recycle（已弃用）：简单擦除数据后，PV可被重新绑定。

经验教训：曾有一次误将生产数据库PVC的StorageClass设为Delete策略，Pod重建后所有数据消失。自此，我们为所有关键应用设置双保险：Retain回收策略 + 定时的独立快照备份。

四、实战：部署一个持久化的MySQL实例

下面是一个贴近生产环境的MySQL部署示例，涵盖了关键配置。

步骤1：创建StorageClass（以通用CSI驱动为例）

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: mysql-ssd
provisioner: disk.csi.xxx.com # 替换为实际CSI驱动
parameters:
  type: ssd
  fsType: ext4
reclaimPolicy: Retain # 关键！数据安全第一
allowVolumeExpansion: true

步骤2：使用StatefulSet与PVC部署MySQL

对于有状态服务如MySQL，强烈建议使用StatefulSet而非Deployment，它能提供稳定的网络标识和存储卷管理。

apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: mysql
spec:
  serviceName: mysql
  replicas: 1
  selector:
    matchLabels:
      app: mysql
  template:
    metadata:
      labels:
        app: mysql
    spec:
      containers:
      - name: mysql
        image: mysql:8.0
        env:
        - name: MYSQL_ROOT_PASSWORD
          value: "securepassword"
        ports:
        - containerPort: 3306
          name: mysql
        volumeMounts:
        - name: data # 挂载点名称，对应volumeClaimTemplates
          mountPath: /var/lib/mysql
      # 关键：设置安全上下文，解决容器用户与存储卷的权限问题
      securityContext:
        fsGroup: 999
        runAsUser: 999
        runAsGroup: 999
  # StatefulSet的核心：自动为每个Pod实例创建PVC
  volumeClaimTemplates:
  - metadata:
      name: data
    spec:
      accessModes: [ "ReadWriteOnce" ]
      storageClassName: "mysql-ssd"
      resources:
        requests:
          storage: 50Gi

为什么用StatefulSet？

为每个Pod提供稳定的、唯一的网络标识（如mysql-0, mysql-1）。
通过volumeClaimTemplates为每个Pod实例自动创建独立且稳定的PVC/PV。
提供有序的部署、扩缩容和终止流程，非常适合数据库等有状态应用。

步骤3：验证数据持久性

# 1. 创建测试数据
kubectl exec mysql-0 -- mysql -uroot -psecurepassword -e "CREATE DATABASE test_persistent;"

# 2. 模拟Pod故障重建
kubectl delete pod mysql-0
# 等待StatefulSet控制器重建Pod

# 3. 验证数据是否保留
kubectl exec mysql-0 -- mysql -uroot -psecurepassword -e "SHOW DATABASES;"
# 输出中应能看到 `test_persistent` 数据库

五、避坑指南：常见陷阱与解决方案

坑1：访问模式不匹配

# 错误场景：应用需要多节点读写，但PV/PVC只支持单节点读写
accessModes:
  - ReadWriteOnce  # RWO，仅允许一个节点挂载为读写模式

解决方案：

仔细评估应用的真实需求：
- ReadWriteOnce (RWO)：单节点读写（如MySQL、Redis）。
- ReadOnlyMany (ROX)：多节点只读（如配置文件）。
- ReadWriteMany (RWX)：多节点读写（如共享文件存储）。
注意云环境限制：AWS EBS、阿里云云盘等块存储通常只支持RWO。如需RWX，需选用NAS、NFS或对象存储方案。

坑2：回收策略配置错误

# 危险配置：对存储关键数据的PV使用Delete策略
persistentVolumeReclaimPolicy: Delete

最佳实践：

关键数据：始终使用Retain策略，并建立独立的备份体系。
临时/缓存数据：可使用Delete策略，但需有清晰的资源标记。
定期审计：使用命令 kubectl get pv 检查集群中PV的回收策略。

坑3：节点亲和性导致调度失败

某些存储类型（如Local本地卷）或云盘（绑定特定可用区）具有拓扑限制，可能导致Pod无法被调度到拥有PV的节点上。 解决方案：

了解所用存储类型的约束（区域、可用区、节点）。
为有状态应用配置合适的PodAntiAffinity，避免实例挤在同一节点，同时确保StorageClass的拓扑约束与调度策略一致。

坑4：权限问题导致应用无法写入

容器内进程的用户ID（UID）/组ID（GID）与持久卷上文件系统的所有者不匹配，导致“Permission denied”。 终极解决方案：在Pod定义中设置安全上下文，特别是fsGroup，K8s会在挂载时自动修改卷的组所有权。

securityContext:
  runAsUser: 999 # 非root用户运行
  runAsGroup: 999
  fsGroup: 999    # 关键！设置卷的组ID

六、高级技巧与最佳实践

1. 存储卷在线扩容

在StorageClass支持 (allowVolumeExpansion: true) 且底层存储驱动允许的前提下，可以动态扩容PVC。

# 修改PVC的容量请求
kubectl patch pvc data-mysql-0 -p '{"spec":{"resources":{"requests":{"storage":"100Gi"}}}}'
# 观察PVC和PV的状态变更
kubectl get pvc data-mysql-0 -w

注意：扩容后，容器内文件系统可能仍需扩展（如执行resize2fs），部分现代CSI驱动可自动完成。

2. 快照与备份

利用VolumeSnapshot API为持久化数据创建时间点快照，这是数据安全的最后防线。

apiVersion: snapshot.storage.k8s.io/v1
apiVersion: snapshot.storage.k8s.io/v1
kind: VolumeSnapshot
metadata:
  name: mysql-backup-20240515
spec:
  volumeSnapshotClassName: csi-snapclass
  source:
    persistentVolumeClaimName: data-mysql-0 # 对哪个PVC做快照

生产环境应结合CronJob实现定时快照，并将快照数据传输至异地或对象存储。

3. 存储监控

必须监控的关键指标包括：

PVC使用率：避免使用率过高导致Pod被驱逐。
PV状态：定期清理Released状态的PV，释放资源。

存储后端性能：监控IOPS、吞吐量和延迟。

# 快速检查未绑定的PVC和已释放的PV
kubectl get pvc --all-namespaces | grep -v Bound
kubectl get pv | grep Released

七、总结

Kubernetes的存储设计体现了清晰的职责分离思想：

集群管理员：规划和提供存储资源（定义StorageClass，管理物理存储）。
应用开发者：通过PVC声明存储需求，无需关心底层实现。
K8s系统：自动化地完成资源的匹配、绑定和生命周期管理。

三条核心原则：

永远验证持久性：除非明确配置并测试验证，否则永远假设数据会在Pod生命周期外丢失。
拥抱动态供给：使用StorageClass进行动态供给，避免手动管理PV的运维负担。
备份高于一切：再可靠的存储也可能故障，定期测试的独立备份方案是数据安全的终极保障。

上一篇：Spring框架重试机制核心解析：RetryTemplate与策略源码执行流程拆解
下一篇：Shell脚本实战：7个生产级服务器巡检脚本与自动化运维指南

Kubernetes, 持久化存储, PV／PVC, StorageClass, StatefulSet