HashMap - 1.7

类简介

HashMap 是一个用来存储 Key - Value 键值对的集合，每一个键值对也叫做 Entry，这些 Entry 保存在底层数组中。

1. 底层数组

底层数组包含的每个元素可以称之为桶，元素实际保存在每个桶上。

java

    static final Entry<?,?>[] EMPTY_TABLE = {};

    /**
     * The table, resized as necessary. Length MUST Always be a power of two.
     */
    transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;

2. Entry 类

Entry 类实际上是一个单向的链表结构，它具有 Next 指针，来链接下一个 Entry 实体。

java

    static class Entry<K,V> implements Map.Entry<K,V> {
            //key值
            final K key;
            //value值
            V value;
            //下一节点
            Entry<K,V> next;
            //当前节点hash值
            int hash;

            /**
             * Creates new entry.
             */
            Entry(int h, K k, V v, Entry<K,V> n) {
                value = v;
                next = n;
                key = k;
                hash = h;
            }

            ......

    }

3. 负载因子 - loadFactor

负载因子与数组的扩容机制有关，主要用来计算扩容临界值 - threshold。

4. 扩容临界值 - threshold

threshold 表示的是底层数组发生扩容的临界值，用于计算底层数组是否需要扩容。

5. 元素长度 - size

size 表示 HashMap 中实际保存元素的个数。

在新建 Entry 时会执行 size++；

java

    void createEntry(int hash, K key, V value, int bucketIndex) {
      	//获取索引位置上原来的Entry
        Entry<K,V> e = table[bucketIndex];
      	//索引执行新建的Entry。（新建的Entry的next执行原来的Entry，实现头插）
        table[bucketIndex] = new Entry<>(hash, key, value, e);
      	//数组内部元素长度+1
        size++;
    }

存储元素的原理

采用 数组 + 链表 的形式存储。

数组是为了确定元素所在桶的位置，数组中每个元素初始值都是 NULL。新增元素所在桶位置和 Key 值 和 底层数组长度值 有关。
对 Key值 进行 Hash 算法 得到的结果值 Hash(key)，与 数组长度 - 1 得到的结果值进行 与运算 ，得到元素对应的桶位置。
计算公式为：index = Hash(key) & (length-1)
链表是为了解决 索引冲突 问题，当出现元素计算的 桶位置 一样的情况时，就出现了冲突问题，也叫做 哈希冲突 。1.7 采用了 拉链法 解决哈希冲突，在此时桶的位置上上形成一个链表来保存元素。

通过特定 Hash 算法计算 Key 的 Hash 值。
通过 Key 的 Hash 值和长度 - 1 的与运算结果，得到底层数组对应桶位置 Index。
若数组对应的 index 位置为 NULL，将 Entry 存放到数组的 index 位置上。
若数组对应的 index 位置不为 NULL，即发生了索引冲突，此时采用链表的方式来保存元素，新增的元素会保存在链表的头部，并存放到数组对应的 index 位置上（头插法）。

为什么引入链表？

通过 Hash 算法计算元素所在的桶位置时，可能会发生 哈希冲突，即多个元素对应同一个桶。此时为了解决哈希冲突的问题， 1.7 采用了拉链法 。在发生冲突的桶位置上，生成一个链表按照一定顺序保存元素，来解决哈希冲突。

为什么采用头插法？

头插法
在链表增加新增元素时，默认添加到首位。
尾插法
在链表增加新增元素时，默认添加到末尾。

当发生哈希冲突时，向链表插入元素的过程为：

计算元素所在桶位置 index。

遍历 index 位置对应的链表，判断是否包含和插入元素相同 Key 值的元素。（从 index 位置保存的元素开始循环）

若在链表中找到相同 Key 值，将新 Value 值赋值给 Value，并返回 Key 对应的旧的 Value值。

java

public V put(K key, V value) {
  			//初始容量扩容
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
  			//允许存为null的key
        if (key == null)
            return putForNullKey(value);
  			//对key进行hash算法
        int hash = hash(key);
  			//通过hash和数组长度的位运算来计算索引位置
        int i = indexFor(hash, table.length);
  			//从index位置开始遍历链表
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
          	//若hash值一致，key一致的话，则替换元素
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
              	//更新元素value值
                e.value = value;
                e.recordAccess(this);
              	//返回元素对应旧值
                return oldValue;
            }
        }
		//修改次数+1（用于迭代器判断并发修改异常）
        modCount++;
  		//添加元素
        addEntry(hash, key, value, i);
  			//首次新增，返回null
        return null;
    }

若遍历链表未找到相同元素，则开始插入元素。

java

    void addEntry(int hash, K key, V value, int bucketIndex) {
      	//底层数组扩容
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }
				//创建新元素
        createEntry(hash, key, value, bucketIndex);
    }
		
		//bucketIndex；对应数组中的索引。
    void createEntry(int hash, K key, V value, int bucketIndex) {
      	//获取数组中索引对应的旧元素（即链表的首位）
        Entry<K,V> e = table[bucketIndex];
      	//将插入元素初始化，设置链表旧的头部元素为Next，并将生成的 Entry 存放到数组对应的索引位置。（头插法）
        table[bucketIndex] = new Entry<>(hash, key, value, e);
        //hashmap内元素总数+1
        size++;
    }

整个链表的插入过程分为两部分。

头插法和尾插法都会先循环遍历链表，将链表中所有元素和要插入的元素都比较一遍，来判断链表是否存在相同的 key。

如果链表存在相同的 key，直接覆盖，此时头插法和尾插法效率相同。
如果链表 不存在 相同的 key，此时头插法和尾插法效率也是相同的。
因为当不存在相同 key 时，链表会被从头遍历到尾，而遍历结束可以得到头尾节点，此时执行插入效率是一样的。

综上所述，头插法和尾插法在效率上是一致的，1.7之所以采用头插法，是因为热点数据的原因。在使用 HashMap 的时候，更倾向于获取最新插入的数据，所以将新数据插入到链表头部，方便获取最新插入的数据。

注意：JDK 1.8 已改为尾插法。

底层扩容原理？

在向 HashMap 中新增元素的时候，涉及到对底层数组容量扩容的一个机制。

底层数组初始化

HashMap 底层数组采用的是懒加载，新建时不会初始化底层数组，只有在第一次新增时才会初始化底层数组，分配内存空间。

在新建 HashMap 的时候，并不会初始化底层数组。

java

    //默认底层数组容量为16
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

    //默认负载因子为0.75
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

	//扩容临界值
    int threshold;

    //负载因子
    final float loadFactor;

		public HashMap() {
        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
    }
    
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
		//指定扩容因子
        this.loadFactor = loadFactor;
      	//指定扩容临界值
        threshold = initialCapacity;
        init();
    }

在第一次调用 put() 方法添加元素时，会对底层数据进行初始化。

java

    public V put(K key, V value) {
      	//判断是否首次扩容
        if (table == EMPTY_TABLE) {
          	//执行扩容
            inflateTable(threshold);
        }
      
        ......
        modCount++;
      	//添加Entry（非首次扩容发生在这个方法里面）
        addEntry(hash, key, value, i);
        return null;
    }
		
	//扩容方法
    private void inflateTable(int toSize) {
        // Find a power of 2 >= toSize
      	// 计算离数组容量值最近的2次幂值。比如 10 =》16；16=》16
        int capacity = roundUpToPowerOf2(toSize);
		//第一次赋值扩容临界值。等于数组容量*扩容因子
        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
      	//初始化数组容量
        table = new Entry[capacity];
        initHashSeedAsNeeded(capacity);
    }

在首次初始化底层数组的时候，会赋值扩容临界值 threshold，用于之后判断底层数组是否需要扩容。
首次扩容临界值 = 初始数组长度 16 * 默认负载因子 0.75 = 12

java

 //扩容临界值 = 初始数组长度 16 * 默认负载因子 0.75 = 12 
threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);

添加元素时扩容(重要)

在每次新增元素调用 put 方法的时候，都会对 hashmap 进行检查是否达到了扩容条件。

调用 put 方法，若是匹配到相同 key 值，则更新 value。若是未匹配到，则新增元素。

JAVA

    public V put(K key, V value) {
        //判断底层数据是否为空（是否首次添加元素）
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        //对 key=null 情况做特殊处理，放到第0个桶上
        if (key == null)
            return putForNullKey(value);
        //新增元素的key进行哈希算法
        int hash = hash(key);
        //计算新增元素所在的桶
        int i = indexFor(hash, table.length);
        //若桶不为空，开始遍历桶上的链表(判断是否更新)
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            //匹配链表上是否有相同 key 的元素
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                //匹配到相同 key，更新 value
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
	
        modCount++;
        //重要，新增元素
        addEntry(hash, key, value, i);
        return null;
    }

判断是否需要发生扩容？

JAVA

    void addEntry(int hash, K key, V value, int bucketIndex) {
        //扩容条件判断，满足条件开始扩容
        //1.hashmap中元素数量 >= 扩容临界值（数组容量*负载因子 =》默认16）
        //2.新增元素对应桶不为空
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }
		//新增元素
        createEntry(hash, key, value, bucketIndex);
    }

采用头插法，新增元素

JAVA

    void createEntry(int hash, K key, V value, int bucketIndex) {
        //获取桶上头节点
        Entry<K,V> e = table[bucketIndex];
        //采用头插法，将原有的头节点点作为后继。
        table[bucketIndex] = new Entry<>(hash, key, value, e);
        size++;
    }

非首次扩容发生的条件？

总共有两个条件，缺一不可。

元素总量大于等于扩容临界值。
扩容临界值 = 底层数组容量 * 负载因子
threshold = capacity * loadFactor
新增元素对应的桶不为空。

JAVA

    void addEntry(int hash, K key, V value, int bucketIndex) {
        //扩容条件判断
        //1.hashmap中元素数量 >= 扩容临界值（数组容量*负载因子 =》默认16）
        //2.新增元素对应桶不为空
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }
		//新增元素
        createEntry(hash, key, value, bucketIndex);
    }

即使 hashmap 中元素总数量大于等于扩容临界值的时候，也不一定发生扩容。因为还有一个条件必须满足，即新增元素对应的桶不为空。

底层数组扩容过程

扩容的步骤

按照旧数组长度的 2 倍初始化新数组。
将旧数组的元素全部转移到新数组中。（需要重新计算元素所在索引位置）
- 遍历旧数组上的每一个 Entry 链表（Entry 内部维护了 next字段，指向下一节点的 Entry）。
  - 循环每个 Entry 链表的每个Entry 实体类，根据新数组长度重新计算索引位置（索引位置受数组长度的影响，数组长度改变，对应索引也需要改变）。
  - 采用头插法将每个 Entry 插入到新数组中。
  - 直到链表循环结束。
- 旧数组遍历结束，即旧数组元素转移到新数组完毕。
将新数组（长度为旧数组的 2 倍）赋值给底层数组。
赋值扩容临界值（新数组长度 * 负载因子）。

java

 	public V put(K key, V value) {
      	//判断是否首次扩容
        if (table == EMPTY_TABLE) {
          	//执行扩容
            inflateTable(threshold);
        }
      
        ......
        modCount++;
      	//添加Entry（非首次扩容发生在这个方法里面）
        addEntry(hash, key, value, i);
        return null;
    }
    
	//添加Entry
    void addEntry(int hash, K key, V value, int bucketIndex) {
      	//数组内部长度 >= 临界值 && 元素索引位置不为空
        if ((size >= threshold) && (null != table[bucketIndex])) {
          	//扩容（底层数组的二倍）
            resize(2 * table.length);
          	//对新增元素进行 Hash
            hash = (null != key) ? hash(key) : 0;
          	//计算新增元素在新数组中的索引位置
            bucketIndex = indexFor(hash, table.length);
        }
        createEntry(hash, key, value, bucketIndex);
    }

    void resize(int newCapacity) {
      	//旧的底层数组
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
      	//是否数组最大值
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
		//按照旧数组长度的二倍初始化新的数组
        Entry[] newTable = new Entry[newCapacity];
      	//将旧数组的元素全部转移到新数组（需要重新 Hash）
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
      	//将新数组赋值给底层数组
        table = newTable;
      	//根据新数组长度，修改扩容临界值。（新数组长度*负载因子）
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
		
	//将旧数组所有元素移动到新数组
    void transfer(Entry[] newTable, boolean rehash) {
      	//新数组长度
        int newCapacity = newTable.length;
      	//遍历旧数组每个元素
        for (Entry<K,V> e : table) {
          	//遍历每个元素的链表结构
            while(null != e) {
              	//获取节点的下一节点
                Entry<K,V> next = e.next;
              	//重新 Hash
                if (rehash) {
                  	//key ！= null 时计算 key 的 Hash 值
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
              	//通过 key 的 Hash 值和新数组长度的与运算来计算元素所在索引。（重新计算的目的，是因为数组长度发生了变化）
                int i = indexFor(e.hash, newCapacity);
              	//头插法，当前节点下一节点执行新数组的头节点
                e.next = newTable[i];
              	//头插法，将当前节点作为头节点赋值给数组索引位置
                newTable[i] = e;
              	//将下一节点值赋值给 e ，开始下一轮循环，直到链表循环结束。
                e = next;
            }
        }
    }

    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

    void createEntry(int hash, K key, V value, int bucketIndex) {
      	//获取索引位置上原来的Entry
        Entry<K,V> e = table[bucketIndex];
      	//索引执行新建的Entry。（新建的Entry的next执行原来的Entry，实现头插）
        table[bucketIndex] = new Entry<>(hash, key, value, e);
      	//数组内部元素长度+1
        size++;
    }

添加元素 put 方法源码分析（重要）

针对主要的添加元素方法 put(K key, V value) 进行分析。

java

public V put(K key, V value) {
  			//1.初始化数组容量
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
  			//2.允许存为null的key
        if (key == null)
            return putForNullKey(value);
  			//3.对key进行hash算法
        int hash = hash(key);
  			//4.通过hash和数组长度的位运算来计算索引位置
        int i = indexFor(hash, table.length);
  			//5.从index位置开始遍历链表
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
          	//若hash值一致，key一致的话，则替换元素
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
              	//更新元素value值
                e.value = value;
                e.recordAccess(this);
              	//返回元素对应旧值
                return oldValue;
            }
        }
				//修改次数+1（用于迭代器判断并发修改异常）
        modCount++;
  			//添加元素
        addEntry(hash, key, value, i);
  			//首次新增，返回null
        return null;
    }

		//底层数组扩容，传入指定数组容量值
    private void inflateTable(int toSize) {
        // Find a power of 2 >= toSize
      	//计算离数组容量值最近的2次幂值。比如 10 =》16；16=》16
        int capacity = roundUpToPowerOf2(toSize);
				//确认扩容临界点值
        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
      	//初始化底层数组空间（指定长度）
        table = new Entry[capacity];
        initHashSeedAsNeeded(capacity);
    }

		//计算 Key 对应索引位置。数组默认长度必须是2的非零次幂
    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

	//添加Entry
	//新增元素哈希值、key、value、桶位置
    void addEntry(int hash, K key, V value, int bucketIndex) {
      	//数组内部长度 >= 临界值 && 元素索引位置不为空
        if ((size >= threshold) && (null != table[bucketIndex])) {
          	//扩容（底层数组的二倍）
            resize(2 * table.length);
          	//对新增元素进行 Hash
            hash = (null != key) ? hash(key) : 0;
          	//计算新增元素在新数组中的索引位置
            bucketIndex = indexFor(hash, table.length);
        }
        createEntry(hash, key, value, bucketIndex);
    }
	
	//底层数组扩容
    void resize(int newCapacity) {
      	//旧的底层数组
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
      	//是否数组最大值
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
		//按照旧数组长度的二倍初始化新的数组
        Entry[] newTable = new Entry[newCapacity];
      	//将旧数组的元素全部转移到新数组（需要重新 Hash）
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
      	//将新数组赋值给底层数组
        table = newTable;
      	//根据新数组长度，修改扩容临界值。（新数组长度*负载因子）
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
		
	//将旧数组所有元素移动到新数组
    void transfer(Entry[] newTable, boolean rehash) {
      	//新数组长度
        int newCapacity = newTable.length;
      	//遍历旧数组每个元素
        for (Entry<K,V> e : table) {
          	//遍历每个元素的链表结构
            while(null != e) {
              	//获取节点的下一节点
                Entry<K,V> next = e.next;
              	//重新 Hash
                if (rehash) {
                  	//key ！= null 时计算 key 的 Hash 值
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
              	//通过 key 的 Hash 值和新数组长度的与运算来计算元素所在索引。（重新计算的目的，是因为数组长度发生了变化）
                int i = indexFor(e.hash, newCapacity);
              	//头插法，当前节点下一节点执行新数组的头节点
                e.next = newTable[i];
              	//头插法，将当前节点作为头节点赋值给数组索引位置
                newTable[i] = e;
              	//将下一节点值赋值给 e ，开始下一轮循环，直到链表循环结束。
                e = next;
            }
        }
    }

    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

    void createEntry(int hash, K key, V value, int bucketIndex) {
      	//获取索引位置上原来的Entry
        Entry<K,V> e = table[bucketIndex];
      	//索引执行新建的Entry。（新建的Entry的next执行原来的Entry，实现头插）
        table[bucketIndex] = new Entry<>(hash, key, value, e);
      	//数组内部元素长度+1
        size++;
    }

若为第一次添加元素，初始化数组容量。
在创建 HashMap 的时候，并不会初始化底层数组，而是在第一次调用 put() 方法的时候，初始化底层数组。（懒加载，节省内存空间）
首次扩容原理

判断 Key == null 的情况，特殊处理（添加到底层数组索引为 0 的位置）。

java

    //添加 key == null
		private V putForNullKey(V value) {
      	//遍历底层数组索引为0的链表
        for (Entry<K,V> e = table[0]; e != null; e = e.next) {
            if (e.key == null) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
              	//找到，返回oldValue
                return oldValue;
            }
        }
        modCount++;
      	//未找到，在0索引上新增Entry（key为null，value为传入的value，索引位置为0）
        addEntry(0, null, value, 0);
        return null;
    }

对 Key 进行 Hash 算法。

java

    final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }

        h ^= k.hashCode();

        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

计算元素所在桶位置。
得到 Key 的 Hash 算法值之后，与数组长度 - 1的结果进行与运算，得到元素对应的索引位置。
java
```
    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }
```
1
2
3
4
可以看到源码注释中提示了 length must be a non-zero power of 2，即长度必须限制为 2 的非零次幂。
[数组长度为什么限制为 2 的非零次幂？](数组长度为什么限制为 2 的非零次幂？)
[数组默认长度是 16 的原因？](数组默认长度是 16 的原因？)
遍历桶位置的链表。
- 若遍历链表找到 Key 相同的元素，则替换 Value，返回旧的 Value。
- 若遍历链表未找到 Key 相同的元素，继续往下。
modCount （修改次数） +1，避免并发修改异常。

添加元素。

判断是否达到扩容条件，若满足则扩容，若不满足扩容条件，则不扩容，而后创建元素。

JAVA

	//添加Entry
	//新增元素哈希值、key、value、桶位置
    void addEntry(int hash, K key, V value, int bucketIndex) {
      	//hashmap元素长度 >= 临界值 && 元素索引位置不为空
        if ((size >= threshold) && (null != table[bucketIndex])) {
          	//扩容（底层数组的二倍）
            resize(2 * table.length);
          	//对新增元素进行 Hash
            hash = (null != key) ? hash(key) : 0;
          	//计算新增元素在新数组中的索引位置
            bucketIndex = indexFor(hash, table.length);
        }
        createEntry(hash, key, value, bucketIndex);
    }

底层数组扩容方法。

新数组为旧数组的两倍，需要将旧数组所有元素进行重新哈希，放到新数组上。

JAVA

	//底层数组扩容
    void resize(int newCapacity) {
      	//旧的底层数组
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
      	//是否数组最大值
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
		//按照旧数组长度的二倍初始化新的数组
        Entry[] newTable = new Entry[newCapacity];
      	//将旧数组的元素全部转移到新数组（需要重新 Hash）
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
      	//将新数组赋值给底层数组
        table = newTable;
      	//根据新数组长度，修改扩容临界值。（新数组长度*负载因子）
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
		
	//将旧数组所有元素移动到新数组
    void transfer(Entry[] newTable, boolean rehash) {
      	//新数组长度
        int newCapacity = newTable.length;
      	//遍历旧数组每个元素
        for (Entry<K,V> e : table) {
          	//遍历每个元素的链表结构
            while(null != e) {
              	//获取节点的下一节点
                Entry<K,V> next = e.next;
              	//重新 Hash
                if (rehash) {
                  	//key ！= null 时计算 key 的 Hash 值
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
              	//通过 key 的 Hash 值和新数组长度的与运算来计算元素所在索引。（重新计算的目的，是因为数组长度发生了变化）
                int i = indexFor(e.hash, newCapacity);
              	//头插法，当前节点下一节点执行新数组的头节点
                e.next = newTable[i];
              	//头插法，将当前节点作为头节点赋值给数组索引位置
                newTable[i] = e;
              	//将下一节点值赋值给 e ，开始下一轮循环，直到链表循环结束。
                e = next;
            }
        }
    }

在对应桶创建元素。

JAVA

 void createEntry(int hash, K key, V value, int bucketIndex) {
      	//获取索引位置上原来的Entry
        Entry<K,V> e = table[bucketIndex];
      	//索引执行新建的Entry。（新建的Entry的next执行原来的Entry，实现头插）
        table[bucketIndex] = new Entry<>(hash, key, value, e);
      	//数组内部元素长度+1
        size++;
 }

返回 null。

查询元素 get 方法源码分析（重要）

以get(Object key) 方法来分析。

java

    public V get(Object key) {
      	//key为null时单独处理
        if (key == null)
            return getForNullKey();
      	//根据key查询Entry
        Entry<K,V> entry = getEntry(key);
				//返回value值
        return null == entry ? null : entry.getValue();
    }

		//查询key为null的Entry对应value值
    private V getForNullKey() {
      	//数据长度为null，返回null
        if (size == 0) {
            return null;
        }
      	//开始遍历底层数组索引0位置的链表
        for (Entry<K,V> e = table[0]; e != null; e = e.next) {
          	//匹配到key值，返回value
            if (e.key == null)
                return e.value;
        }
      	//未找到，返回null
        return null;
    }

		//根据key值找到对应Entry的value值
    final Entry<K,V> getEntry(Object key) {
        if (size == 0) {
            return null;
        }
				//计算key值的hash值
        int hash = (key == null) ? 0 : hash(key);
      	//获取key值对应底层数组的桶，开始遍历该桶位置的链表
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
          	//若hash值一致且key值一致（地址值相等或者内容相等）
          	//hash值相等的时候，代表key的hashcode是相等的。此时使用equals方法，整个链表比较key都是一致的，所以需要重写equals和hashcode方法。
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k))))
              	//返回Entry
                return e;
        }
        return null;
    }

		//根据key的hash值和数组长度计算，Entry对应底层数组的索引位置
    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

整个查询分两种情况。

当 key == null 时，从数组索引 0 处开始查询 Entry。
因为 key == null 属于一种特殊情况，在插入时插入到了底层数组索引 0 的位置。所以查询时直接从 index = 0 位置开始查询。
- 从头开始遍历查询 index = 0 位置的链表。
- 若找到 Entry 的 key ==null，返回该 Entry 的 value；
- 若未找到，则返回 null。
当 key != null 时。
- 计算 key 的 Hash 值（特定 Hash 算法）。
- 计算 key 值对应的底层数组桶位置，计算公式为 index = hash & (length-1);
- 从 index 位置的头节点开始遍历链表。
- 比较 key 值。
  该链表的所有元素 Hash 值都是一致的（因为计算得到的 index 是一致的）。
  所以在比较 key 值是否一致时，需要重写 equals 和 hashcode 方法。
- 若找到与传入 key 一致的，则返回 Entry 里的 value 值。
- 若未找到则返回 null。

删除元素 remove 方法源码分析

JDK 1.7 的删除方法较为简单，理解单向链表的删除原理，再结合源码即可。

java

    public V remove(Object key) {
      	//返回删除的Entry
        Entry<K,V> e = removeEntryForKey(key);
      	//Entry不为空，返回value
        return (e == null ? null : e.value);
    }

		//删除key值的主要方法
    final Entry<K,V> removeEntryForKey(Object key) {
        if (size == 0) {
            return null;
        }
      	//计算key的hash值
        int hash = (key == null) ? 0 : hash(key);
      	//找到key对应的桶
        int i = indexFor(hash, table.length);
      	//获取桶对应Entry
        Entry<K,V> prev = table[i];
        Entry<K,V> e = prev;
				//循环链表
        while (e != null) {
          	//下一节点
            Entry<K,V> next = e.next;
            Object k;
          	//比较hash和key值（需要重写equals和hashcode方法），匹配到一致key
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k)))) {
              	//操作变量加1（防止并发异常）
                modCount++;
              	//数据总量减1
                size--;
              	//a.若匹配节点为头节点
                if (prev == e)
                  	//桶指向下一节点
                    table[i] = next;
                //b.不为头节点。
                else
                  	//前驱的下一节点指向待删除节点的下一节点
                    prev.next = next;
              	//linkedHashMap每次删除都会调用
                e.recordRemoval(this);
                return e;
            }
          	//准备遍历下一节点
          	//前驱指向当前节点
            prev = e;
          	//当前节点指向下一节点
            e = next;
        }
        return e;
    }

常见问题

1. 数组默认长度是 16 的原因？

符合 HashMap 数组长度是 2 的非零次幂
为了方便计算元素在数组中的桶 index 的 Hash 算法。
16 属于一个经验值。结合数组扩容机制，太小了就有可能频繁发生扩容，影响效率。太大了又浪费空间，不划算。

java

    //h:key的hash值，length：数组长度
    static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

可以看到计算 index 的公式为 index = HashCode(key) & (length-1)，对应 Key 的 HashCode 值 和 数组长度 - 1 之间的与运算。

默认 length = 16。此时 index = HashCode(key) & 1111
假设 HashCode(key)= 3029737，对应二进制位 HashCode(key)= 101110001110101110 1001。
此时与运算结果为 101110001110101110 1001 & 1111 = 1001 。
对应 index = 9。
假设 length = 10。此时 index = HashCode(key) & 1001
此时与运算结果为 101110001110101110 1001 & 1001 = 1001 。
对应 index=9。
此时会发现，有些结果永远得不到，比如 0011 （x & 1001 ! = 0011），此时会存在 index = 3 的结果不会出现，数组索引 3 的位置上不会保存元素，不满足 Hash 算法均匀分布的原则。

综上所述：

通过与运算来确认索引桶位置的时候，和 Key 的 HashCode 值的最后四位有很大关系。

默认数组长度为 16 时，length-1 的值是 1111 ，所有二进制位都为 1。与运算的结果等同于 HashCode(key) 的后 4 位的值，此时只要 HashCode(key) 足够均分，那么与运算计算出的 index 的结果也是均分的，能够满足 Hash 算法均匀分布的原则。

2. 数组长度为什么限制为 2 的非零次幂？

为了方便计算元素在数组中的索引桶 index 的 Hash 算法。

计算 index 的公式为 index = HashCode(key) & (length-1)，对应 Key 的 HashCode 值 和 数组长度 - 1 之间的与运算。

当数组长度为 2 的非零次幂时，此时对应二进制结果为首位为 1，后面都是 0。此时的 length - 1 的二进制位上都是 1。此时与运算的结果等同于 HashCode(key) 对应后几位的值。只要 HashCode(key) 结果足够均分，得到的 index 结果就是均分的，满足 Hash 算法均匀分布的原则。同时不浪费数组空间。

综上所述，原因主要为以下几点：

方便计算元素在数组中的索引 index 的 Hash 算法，使其满足 Hash 算法均匀分布的原则。
不浪费数组空间。

3. 为何负载因子默认为 0.75？（重要）

这个问题需要搭配扩容机制来看，可以理解为为什么要在 hashmap 元素总数大于等于底层数组长度的 0.75 倍时可以扩容？

主要目的是为了减少索引冲突的次数。

索引冲突的原因？

在计算元素在底层数组位置时，根据 Key 的 Hash 值（特定 Hash 算法），和长度 - 1的与运算，得到元素在数组中的索引位置，公式为 index = HashCode(key) & (length-1)。

此时会存在不同的 Key 值得到的 index 值可能会相同（这也是引入链表的原因）。而 index 相同时就会以头插法的形式追加到链表中，此时若相同 index 元素越多，链表就会越长。

不同值碰撞的机率对比

当 loadFactor = 0.75 时，此时新增元素计算索引时，发生碰撞的最大机率为 0.75。

对比来看，若 loadFactor = 0.95 时，新增元素发生碰撞的最大机率为 0.95。

碰撞几率越高，对应数组扩容的机率就会越低，此时空间利用率高。

底层扩容原理

而碰撞会导致对应的索引位置的链表长度变长，此时若增加元素效率就会变低，即时间效率低。

结论

所以当负载因子越大时，碰撞几率越大，发生扩容机率越低，链表长度会越长，而此时效率会越来越低，但是空间利用率会高。

总结而言，选择负载因子为 0.75 是一种以空间换时间的考虑，牺牲了空间利用率来提高效率。

4. 多线程导致的死循环问题？（重要）

在多个线程操作时，若底层数组执行扩容，就有可能会发生循环链表的情况。

扩容之前若存在链表 A -> B -> C ，若 A、B、C 扩容后对应的 index 一致，则采用头插法后的链表顺序为 C -> B ->A。

这个机制在多线程的环境下，有可能发生死循环的情况，类似 A -> B -> C -> B。

如果扩容前位于同一链表的两个 Entry 在扩容后还是分配到相同的 index 上，就会出现死循环的问题。根本原因还是链表的插入方式采用的是头插法，这样会导致链表顺序反过来。

头插法改变了链表的顺序，多线程情况，其它线程可能保留扩容前的链表关系，执行时发生死循环。

5. 多线程导致的元素丢失问题？（重要）

同时执行 put 操作导致元素丢失
多个线程在执行 put 操作时，若出现了哈希碰撞，导致两个线程得到的索引位置一致。采取头插法时，若两个线程获取的是同一个头节点，则在 put 操作执行完成后，只有其中一个线程值会插入到头节点，导致其它线程插入的丢失。
例如：线程A 和线程B 分别插入元素 1111 和元素 11111，假设对应索引位置都为 1 。采用头插法时获取的链表头节点都为 1 ，则完成插入之后形成的链表如右图所示，此时会造成元素 11111 丢失。
多个线程同时执行 get 和 put 操作，导致获取元素为 null
在 put 操作执行时，若设置到扩容操作，在扩容完成之后旧数组为空。此时若执行 get 操作返回为 null。
原因就是扩容操作未执行完毕，执行 get 操作时，操作的是旧数组，当旧数组为空时返回都是 null。

添加元素方法源码分析（重要）

参考链接

HashMap和ConcurrentHashMap深入解析源码合集，看完吊打面试官！

掘金-漫画：什么是HashMap？

HashMap面试必问的6个点，你知道几个？

《我们一起进大厂》系列-HashMap

HashMap在多线程下不安全问题(JDK1.7)

HashMap - 1.7 ​

类简介 ​

1. 底层数组 ​

2. Entry 类 ​

3. 负载因子 - loadFactor ​

4. 扩容临界值 - threshold ​

5. 元素长度 - size ​

存储元素的原理 ​

为什么引入链表？ ​

为什么采用头插法？ ​

底层扩容原理？ ​

底层数组初始化 ​

添加元素时扩容(重要) ​

非首次扩容发生的条件？ ​

底层数组扩容过程 ​

相关问题 ​

添加元素 put 方法源码分析（重要） ​

查询元素 get 方法源码分析（重要） ​

删除元素 remove 方法源码分析 ​

常见问题 ​

1. 数组默认长度是 16 的原因？ ​

2. 数组长度为什么限制为 2 的非零次幂？ ​

3. 为何负载因子默认为 0.75？（重要） ​

索引冲突的原因？ ​

不同值碰撞的机率对比 ​

结论 ​

4. 多线程导致的死循环问题？（重要） ​

5. 多线程导致的元素丢失问题？（重要） ​

参考链接 ​

HashMap - 1.7

类简介

1. 底层数组

2. Entry 类

3. 负载因子 - loadFactor

4. 扩容临界值 - threshold

5. 元素长度 - size

存储元素的原理

为什么引入链表？

为什么采用头插法？

底层扩容原理？

底层数组初始化

添加元素时扩容(重要)

非首次扩容发生的条件？

底层数组扩容过程

相关问题

添加元素 put 方法源码分析（重要）

查询元素 get 方法源码分析（重要）

删除元素 remove 方法源码分析

常见问题

1. 数组默认长度是 16 的原因？

2. 数组长度为什么限制为 2 的非零次幂？

3. 为何负载因子默认为 0.75？（重要）

索引冲突的原因？

不同值碰撞的机率对比

结论

4. 多线程导致的死循环问题？（重要）

5. 多线程导致的元素丢失问题？（重要）

参考链接