ConcurrentHashMap是如何解决并发问题的？

本文部分参考：吊打Java面试官之ConcurrentHashMap（线程安全的哈希表） | 二哥的Java进阶之路

ConcurrentHashMap

JDK 1.7

在JDK 1.7中，ConcurrenctHashMap采用了分段锁的机制，把整个HashMap分成了多个Segment，当某个桶需要加锁时，只会锁住对应的Segment，而不是整个Map。如图：
JDK 1.7的ConcurrentHashMap
同时，在单个Segment的内部，也存有若干Entry（即内部有一个Entry数组）：
JDK 1.7 Segment结构
基于以上特殊结构，不难发现：

操作	是否能并发执行
对不同Segment进行写操作	是
对同一Segment进行读写操作	是
对同一Segment进行写操作	否

get方法

伪代码如下：

// ConcurrentHashMap 类的 get 方法
V get(Object key) {
    // 1. 如果 key 为 null，抛出 NullPointerException
    if (key == null) {
        throw new NullPointerException();
    }

    // 2. 计算 key 的哈希值，并将其扩展，以减少哈希冲突。
    int h = hash(key);

    // 3. 根据哈希值定位到具体的 Segment。
    // Segment 是一个独立的锁，整个 get 过程都不需要获取它。
    Segment s = segments[h % segments.length];

    // 4. 在定位到的 Segment 中，根据哈希值找到对应的 HashEntry 数组索引。
    // 这一步也是无锁的。
    HashEntry[] tab = s.table;
    int index = (tab.length - 1) & h;

    // 5. 遍历该索引处的链表（或红黑树，但在 JDK 1.7 中是链表）
    // 这个遍历也是无锁的。
    for (HashEntry<K,V> e = tab[index]; e != null; e = e.next) {
        // 6. 检查当前 HashEntry 是否是我们要找的键值对。
        // 使用哈希值和 equals 方法进行双重检查。
        if (e.hash == h && key.equals(e.key)) {
            // 7. 核心：返回 HashEntry 的 value 字段。
            // 因为 value 字段是用 volatile 修饰的，这保证了内存可见性。
            // 当其他线程通过 put 或 remove 修改了 value 后，这个线程能立即看到最新值。
            return e.value;
        }
    }

    // 8. 如果遍历完整个链表都没有找到，则返回 null。
    return null;
}

整个方法都没有使用 synchronized 或 ReentrantLock 来加锁。这也是ConcurrentHashMap读取效率高的原因。
HashEntry 中的 value 字段被声明为 volatile。这保证了当一个线程更新了值后，这个更新对所有其他线程都是立即可见的，从而避免了脏读。

put方法

伪代码如下：

// ConcurrentHashMap 类的 put 方法
V put(K key, V value) {
    // 1. 如果 key 或 value 为 null，抛出异常。
    if (key == null || value == null) {
        throw new NullPointerException();
    }

    // 2. 计算 key 的哈希值。
    int h = hash(key);

    // 3. 根据哈希值定位到具体的 Segment。
    // 这也是分段锁的核心。
    Segment<K,V> s = segments[h % segments.length];

    // 4. 获取 Segment 锁。
    // 这一步是 put 方法与 get 方法最大的不同，它确保了数据修改的线程安全。
    s.lock();

    try {
        // 5. 在 Segment 内部执行操作。
        // 获取 HashEntry 数组。
        HashEntry<K,V>[] tab = s.table;

        // 6. 根据哈希值找到 HashEntry 数组中的索引。
        int index = (tab.length - 1) & h;

        // 7. 遍历链表，查找是否已存在相同的键。
        // 如果找到，则更新 value 并返回旧值。
        for (HashEntry<K,V> e = tab[index]; e != null; e = e.next) {
            if (e.hash == h && key.equals(e.key)) {
                // 旧值被 volatile 修饰，确保可见性。
                V oldVal = e.value;
                e.value = value;
                return oldVal;
            }
        }

        // 8. 如果没有找到，则创建新的 HashEntry 并插入到链表头部。
        // 首先，记录旧的链表头。
        HashEntry<K,V> oldHead = tab[index];
        // 创建新的 HashEntry，并将其 next 指向旧的链表头。
        HashEntry<K,V> newEntry = new HashEntry<>(h, key, value, oldHead);
        // 更新数组中对应索引处的引用，使新 entry 成为链表头。
        tab[index] = newEntry;

        // 9. 增加 Segment 的 size。
        s.count++;

        // 10. 检查是否需要对 Segment 进行扩容。
        // 如果 size 超过了阈值，则触发扩容操作。
        // 这部分逻辑较为复杂，通常涉及重新哈希和重建数组。
        if (s.count > s.threshold) {
            s.rehash();
        }

        // 11. 如果是新插入的元素，返回 null。
        return null;

    } finally {
        // 12. 释放 Segment 锁。
        // 这一步至关重要，必须确保锁在任何情况下都能被释放。
        s.unlock();
    }
}

// 内部类 HashEntry
// value 字段被 volatile 修饰，保证了内存可见性。
static final class HashEntry<K,V> {
    final int hash;
    final K key;
    volatile V value; // 关键点：volatile 修饰
    volatile HashEntry<K,V> next;

    // ... 构造函数等
}

原本HashMap的put操作是无法保证原子性的，所以使用s.lock()加锁，阻止其它线程访问。
与HashMap不同，ConcurrentHashMap是插入之前判断是否需要扩容，而HashMap是插入之后才判断是否需要扩容。

JDK 1.8

JDK 1.8中，ConcurrentHashMap又进行了优化：

与HashMap相同，采用树化机制防止链表过长
摒弃1.7的分段锁机制，转向以链表头节点/树根节点 加锁，配合CAS + synchronized ，提高并发性能

结构如图：
JDK 1.8的ConcurrentHashMap

put方法

源码截图如下：
JDK 1.8的Put方法源码
其实主要分为三个机制：

桶为空桶时，采用CAS机制插入数据
桶不为空，则用synchronized锁住头节点
需要扩容时，通过 MOVED + helpTransfer确保并发安全

get方法

跟HashMap一样，添加树化机制优化查询效率

补充

CAS机制

CAS（Compare-And-Swap） ，是一种乐观锁机制，是无锁并发编程的核心。伪代码如下：

boolean CAS(address, expected, newValue) {
    if (*address == expected) {
        *address = newValue;
        return true;
    }
    return false;
}

总体流程可以简化为：

判断地址的旧值是否等于期望旧值
如果相等，就认为它没有被其它线程操作，更新旧值为新值
如果不相等，说明它已经被别的线程操作，失败或重试

在 Java 里，CAS 主要依赖 Unsafe 类或 VarHandle 来操作内存。
CAS的缺点：

ABA 问题 ：变量值从 A → B → A，CAS 认为没变，但其实中间变过。
- 解决方案：版本号 + 值 ，即 AtomicStampedReference
自旋开销大 ：多次 CAS 失败会一直自旋，浪费 CPU

ConcurrentHashMap扩容是如何保证并发安全的？

ConcurrentHashMap 是通过 MOVED 标记 + CAS + 分桶锁 来保证安全的。

MOVED标记 ：
当桶的头节点迁移成功时，其hash字段会标记为常量MOVED，此时其它线程会迁移下一个桶
CAS ：
if (casTabAt(oldTable, i, f, MOVED_NODE)) {
// 只有成功的线程才迁移这个桶
moveBucket(f, newTable);
}
CAS操作成功时，说明该线程负责本桶的操作；
如果失败，说明其它线程正在迁移，当前线程就会等待或者迁移下一个桶
分桶锁
迁移桶内部的链表或树节点时，如果涉及到修改节点指针，ConcurrentHashMap 会 只锁当前桶头节点
helpTransfer方法
- 新建扩容后的table
- 每个线程维护一个 迁移索引（transferIndex） ，表示还未迁移的桶范围
- 线程抢到一个桶范围后：
  - 遍历该桶的节点
  - 重新计算新桶位置
  - 插入新表
  - 用 CAS 把旧桶标记为 MOVED