云栈社区»论坛 › 技术文档「 Note & Doc 」 › Java并发：CopyOnWriteArrayList源码解析与实践指南

发回帖发新帖

5736 积分	0 好友	750 主题

发消息

Java并发：CopyOnWriteArrayList源码解析与实践指南

发表于 2026-1-26 07:53:00 | 查看: 245| 回复: 0

在并发编程中，操作List集合的一个核心痛点是：ArrayList非线程安全，直接使用会导致数据错乱；而传统的线程安全方案如Vector或Collections.synchronizedList，又会因为读写互斥而在高并发读场景下性能严重下降。

CopyOnWriteArrayList 作为ArrayList的线程安全升级版，凭借写时复制（COW） 的核心设计，完美解决了高并发读、低并发写场景下的线程安全与性能平衡问题。它是缓存、配置中心等读多写少场景的最优解，也是Java并发面试中的高频考点。

本文将从核心设计思想到底层源码实现，从读写流程拆解到实战选型，彻底搞懂CopyOnWriteArrayList：

写时复制（COW）到底是什么？如何实现读写分离？
为什么它能做到读操作无锁，还能保证线程安全？
写操作的加锁逻辑与数组拷贝，背后藏着哪些性能代价？
它和ArrayList、SynchronizedList、Vector的核心差异是什么？
哪些场景适合用它，哪些场景碰都不能碰？

一、高并发下，ArrayList线程安全方案的性能对比

我们先通过一组高并发性能测试数据（基于JDK8，100个读线程 + 10个写线程，操作10万条数据），直观感受各方案的差距：

集合类型	实现方式	读耗时（ms）	写耗时（ms）	总耗时（ms）	核心问题
`ArrayList`	非线程安全，无同步	12	8	-	数据错乱、数组越界，不可用
`Collections.synchronizedList(ArrayList)`	方法级同步锁，读写互斥	1286	95	1381	读操作被写操作阻塞，高并发读性能极差
`Vector`	方法级同步锁（synchronized），读写互斥	1352	102	1454	重量级锁，效率比SynchronizedList更低
`CopyOnWriteArrayList`	写时复制，读写分离，读无锁 / 写加锁	15	896	911	读操作接近ArrayList原生性能，写操作有额外开销，完美适配读多写少

核心结论：传统线程安全List的核心问题是读写互斥——即使读操作本身不会修改数据，也会被写操作的同步锁阻塞。在高并发场景下「读操作占比往往超90%」，这种设计会严重浪费CPU资源，导致性能瓶颈。

而CopyOnWriteArrayList的写时复制（COW） 设计，彻底打破了「读写互斥」的枷锁：读操作无锁无阻塞，写操作单独加锁，读写操作基于不同的数组副本执行，从根源上解决了高并发读的性能问题。

二、核心思想：写时复制（COW）+ 读写分离

1. 通俗类比：图书馆的「复印资料」模式

想象一个图书馆，藏书就是底层存储数据的数组。

读操作（查阅书籍）：读者直接从书架上拿书看，无需排队、无需登记，多人可同时看同一本书，无锁无阻塞，效率极高。
写操作（新增书籍）：管理员不会直接在书架上添加新书，而是先把所有书复印一份，形成新的书架副本，在新副本上添加新书，完成后将「主书架」替换为新副本。整个写过程加锁，确保同一时间只有一个管理员操作。
读写分离：读操作基于「旧书架副本」，写操作基于「新书架副本」，二者互不干扰。

这个类比对应了CopyOnWriteArrayList的核心特性：

读无锁：读操作直接访问底层数组，无任何同步机制。
写加锁：保证同一时间只有一个写操作。
写时复制：写操作创建原数组副本，在副本上完成修改，再替换原数组。
最终一致性：读操作可能会读到「旧数据」，但最终会读到最新数据。

2. 核心原理：底层实现的三个要点

底层存储：和ArrayList一样基于Object数组，但数组引用被volatile修饰，保证其可见性。
读操作：直接访问当前数组副本，无锁、无校验、无阻塞，时间复杂度O(1)。
写操作：执行「加锁 → 复制原数组 → 副本上修改 → 替换原数组 → 解锁」流程，时间复杂度O(n)。

关键点：volatile修饰的是数组引用，而非数组元素。CopyOnWriteArrayList的写操作从不修改原数组，只替换数组引用，完美利用了volatile的可见性特性。

三、核心结构：源码属性解析（对比ArrayList）

1. 核心属性源码（JDK8精简版）

public class CopyOnWriteArrayList<E>
    implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
    // 写操作的核心锁：保证同一时间只有一个写操作
    final transient ReentrantLock lock = new ReentrantLock();
    // 核心：存储元素的底层数组，volatile修饰保证数组引用的可见性
    private transient volatile Object[] array;
    // 获取当前底层数组
    final Object[] getArray() {
        return array;
    }
    // 设置底层数组（写操作完成后替换数组引用）
    final void setArray(Object[] a) {
        array = a;
    }
    // 无参构造方法：初始化空数组
    public CopyOnWriteArrayList() {
        setArray(new Object[0]);
    }
}

2. 与ArrayList核心属性对比

核心属性	`CopyOnWriteArrayList`	`ArrayList`	核心差异原因
底层数组	`volatile Object[] array`	`transient Object[] elementData`	`volatile`保证数组引用可见性
同步锁	`final ReentrantLock lock`	无	写操作加锁，保证线程安全
元素个数	无单独size属性，通过`array.length`获取	`private int size`	数组不可变，长度即为元素个数
扩容机制	无固定倍数，写操作时按需复制为新长度	自动扩容1.5倍	写时复制天然按需创建新数组

3. 核心结论

数组不可变：底层数组是「只读的」，所有写操作都不会修改原数组，只会创建新数组并替换引用。
锁只为写服务：ReentrantLock仅在写操作时使用，读操作完全无锁。
volatile保证引用可见性：确保写操作替换数组后，所有读线程能立即看到最新数组。
无冗余空间：数组长度始终等于元素个数，内存利用率高。

四、核心操作：读无锁，写复制

1. 读操作：get(int index)——无锁无阻塞

CopyOnWriteArrayList的读操作是所有并发集合中效率最高的，核心原因是无任何同步机制，直接访问数组。

核心源码（JDK8精简版）：

public E get(int index) {
    // 仅两步核心操作，无任何额外封装
    return elementAt(getArray(), index);
}
// 私有工具方法：直接通过数组+下标获取元素
private E elementAt(Object[] a, int index) {
    return (E) a[index];
}

关键细节：

无锁无同步：全程无synchronized、无ReentrantLock。
无下标校验：依赖JVM对数组的原生越界检查。
无modCount校验：底层数组只读不可变，无需担心数据错乱。
直接访问：通过getArray()获取volatile数组，保证内存可见性；通过elementAt()直接执行a[index]访问。

唯一的小缺陷：弱一致性（最终一致性）
读操作可能会读到旧数据——如果写操作正在执行（已复制新数组，尚未替换原数组引用），读操作访问的还是原数组。但在读多写少场景下，这一缺陷几乎可以忽略，满足最终一致性。

2. 写操作：add(E e)——加锁+复制数组

所有写操作的核心流程一致：加锁 → 复制原数组 → 在新数组上执行修改 → 替换原数组引用 → 解锁。

核心源码（以add为例）：

public boolean add(E e) {
    // 1. 获取写操作的独占锁
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        // 2. 获取当前的原数组（旧副本）
        Object[] elements = getArray();
        int len = elements.length;
        // 3. 复制原数组，创建新数组
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        // 4. 在新数组的尾部执行修改
        newElements[len] = e;
        // 5. 替换原数组引用
        setArray(newElements);
        return true;
    } finally {
        // 6. 解锁
        lock.unlock();
    }
}

写操作完整6步流程：

加锁：保证同一时间只有一个写操作。
取原数组：获取当前的底层数组（旧副本）。
复制新数组：创建新数组，O(n)时间复杂度，是核心性能开销。
执行修改：在新数组上完成操作，原数组保持只读。
替换数组引用：将volatile的array指向新数组，这一步是原子的。
解锁：在finally块中释放锁，避免死锁。

3. 其他写操作：set/remove——核心流程一致

无论是set还是remove，核心流程都和add完全一致，仅在「新数组修改」的细节上有差异。

示例：set(int index, E element)核心逻辑

public E set(int index, E element) {
    final ReentrantLock lock = this.lock;
    lock.lock(); // 加锁
    try {
        Object[] elements = getArray();
        E oldValue = elementAt(elements, index);
        if (oldValue != element) { // 元素不同才执行修改
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len); // 复制原数组
            newElements[index] = element; // 新数组上修改
            setArray(newElements); // 替换引用
        } else {
            // 元素相同，无需修改（优化，避免不必要的数组拷贝）
            setArray(elements);
        }
        return oldValue;
    } finally {
        lock.unlock(); // 解锁
    }
}

优化点：如果新值和旧值相同，不会执行数组拷贝，减少不必要的性能开销。

五、核心对比：一张表讲清差异

对比维度	`CopyOnWriteArrayList`	`ArrayList`	`Collections.synchronizedList(ArrayList)`	`Vector`
底层结构	动态Object数组，`volatile`修饰引用	动态Object数组	基于ArrayList包装，同步锁修饰	动态Object数组，方法级同步
线程安全实现	写时复制，读写分离，读无锁/写加锁（ReentrantLock）	非线程安全，无同步	方法级同步锁（synchronized），读写互斥	方法级同步锁（synchronized），读写互斥
读操作性能	极致快（O(1)，无锁无阻塞）	极致快（O(1)，无同步）	慢（O(1)，但被同步锁阻塞）	更慢（O(1)，重量级同步锁）
写操作性能	较慢（O(n)，加锁+数组拷贝）	快（O(1)，尾部增删，扩容时O(n)）	中等（O(n)，同步锁+元素移动/扩容）	较慢（O(n)，重量级锁+元素移动/扩容）
数据一致性	最终一致性（弱一致性）	无一致性保障	强一致性	强一致性
内存开销	写操作时双倍内存（原数组+新数组）	扩容冗余空间（1.5倍）	同ArrayList，无额外开销	扩容冗余空间（2倍）
核心优势	高并发读无锁，性能接近ArrayList，线程安全	轻量，读写极致快	简单易用，基于ArrayList包装	原生JDK支持，历史悠久
核心缺陷	写操作性能差，内存开销大，弱一致性	非线程安全，高并发不可用	读写互斥，高并发读性能极差	性能差，重量级锁
适用场景	读多写少（缓存、配置中心、静态列表）	单线程/低并发，查多增删少	低并发，对一致性要求高，读操作少	几乎不推荐

六、实战避坑：4个高频坑点

坑点1：高并发写场景下使用，导致性能瓶颈+内存溢出

错误场景：处理高频写操作（如实时订单列表）。
核心问题：写操作每次都要加锁和完整数组拷贝（O(n)），高频写导致锁竞争激烈、性能暴跌，同时创建多个副本可能引发OOM。
解决方案：高并发读写场景选择ConcurrentLinkedQueue（无锁CAS）；必须用List可选Collections.synchronizedList（写操作无拷贝开销）。

坑点2：依赖强一致性的场景下使用，导致数据不一致

错误场景：存储金融交易数据、实时库存等需要强一致性的数据。
核心问题：CopyOnWriteArrayList是最终一致性，读操作可能读到旧数据，导致业务逻辑错误。
解决方案：强一致性场景选择Collections.synchronizedList或Vector，或使用ReentrantReadWriteLock自定义实现。

坑点3：存储超大对象/海量数据，写操作时导致内存暴涨

错误场景：存储百万级超大对象（每个对象占1MB以上）。
核心问题：一次写操作会复制整个数组，可能瞬间创建占用数GB内存的新数组，触发GC或OOM。
解决方案：数据分段存储；或选用ConcurrentHashMap；或采用本地缓存+分布式缓存（如Redis）架构。

坑点4：遍历中执行写操作，误以为会触发并发修改异常

错误场景：开发者误以为遍历中写操作会触发ConcurrentModificationException。
核心真相：CopyOnWriteArrayList遍历中执行写操作，不会触发任何异常。
核心原因：遍历基于原数组副本，写操作在新数组上执行，二者互不干扰。
注意点：遍历中写操作的结果，要等到遍历结束后重新获取数组才能看到，这是最终一致性的体现。

七、实战选型：适用场景与禁用场景

✅ 适用场景（读多写少，最终一致性即可）

这是CopyOnWriteArrayList的黄金场景：

缓存场景：本地缓存、热点数据缓存（用户信息、商品信息），读占比极高。
配置中心：系统配置、业务配置的本地存储，配置修改频率极低。
静态列表：省份城市列表、行业分类列表、字典表等几乎不修改的数据。
消息订阅/发布：订阅者高频查询，发布者低频更新订阅关系。
日志收集：低频添加，高频查询/遍历。

❌ 禁用场景（避坑红线）

以下场景必须坚决禁用：

高并发写场景：实时订单、消息队列等，写操作频率高。
强一致性要求场景：金融交易、库存管理等。
海量数据/超大对象场景：存储百万级以上数据或超大对象。
频繁遍历写场景：业务依赖遍历实时数据的场景。

八、总结：理解写时复制的设计思想

CopyOnWriteArrayList的核心竞争力在于其背后的写时复制（COW） 设计思想——读共享，写复制，空间换时间，读写分离。

这种思想不仅应用于此，还广泛见于：

分布式缓存：Redis的RDB持久化。
数据库：MySQL InnoDB的MVCC（多版本并发控制）。
操作系统：Linux的fork()进程创建。

通过源码分析，我们不仅学会了一个工具的使用，更重要的是掌握了一种解决高并发问题的设计思路：跳出“加锁同步”的固有思维，通过读写分离、空间换时间寻找更优解。

技术选型的核心，永远是选择最适配业务场景的技术。CopyOnWriteArrayList不完美，但在其适用场景下，它就是无可替代的最优解。

上一篇：ensun.io如何通过程序化SEO实现B2B网站流量快速增长？
下一篇：MySQL索引优化实战：5个高频技巧提升数据库查询性能

Java, JUC, 高并发, 线程安全, 源码分析