HashMap的put方法的源码分析(Java)

目录

一、HashMap中的一些静态成员变量

1、DEFAULT_INITIAL_CAPACITY

2、MAXIMUM_CAPACITY

3、DEFAULT_LOAD_FACTOR

4、TREEIFY_THRESHOLD

5、UNTREEIFY_THRESHOLD

6、MIN_TREEIFY_CAPACITY

二、HashMap中的构造方法

1、HashMap()

2、HashMap(int)

3、HashMap(int,float)

4、HashMap(Map)

三、HashMap中的put方法

1、初始化底层数组为空的数组容量

2、插入元素

2.1 当前数组下标为空

2.2 当前数组下标不为空

3、数组扩容


一、HashMap中的一些静态成员变量

1、DEFAULT_INITIAL_CAPACITY

表示HashMap底层数组的默认容量是1 << 4,即2^4=16。

2、MAXIMUM_CAPACITY

表示HashMap底层数组的最大容量是1 << 30,即2^30。

3、DEFAULT_LOAD_FACTOR

表示HashMap的默认负载因子的值是0.75。

4、TREEIFY_THRESHOLD

表示底层数组中的链表树化的条件之一:链表中至少有8个节点。

5、UNTREEIFY_THRESHOLD

表示底层数组中的红黑树解树化的条件:树中节点少于6个的时候退化成链表。

6、MIN_TREEIFY_CAPACITY

表示底层数组中的链表树化的条件之一:底层数组的容量至少为64。

二、HashMap中的构造方法

1、HashMap()

        无参的构造方法仅仅指定了负载因子的大小为默认的0.75,并没有初始化底层数组的容量,所以当我们调用无参的构造方法构造一个HashMap,此时底层的数组为NULL,容量为0。 

2、HashMap(int)

        带有一个参数的构造方法可以用来指定底层数组的初始容量,但实际上调用的是下面带有2个参数的构造方法

3、HashMap(int,float)

        构造一个底层数组初始容量为initialCapacity, 负载因子为loadFactor的HashMap,如果initialCapacity小于0或loadFactor小于等于0,就会抛出一个IllegalArgumentException异常,如果initialCapacity大于2^30,则初始容量为2^30。

继续追踪tableSizeFor(initialCapacity),看一下数组的初始容量会被设置为多少:

         tableSizeFor(int cup)方法会将我们传进来的initialCapacity经过一系列位运算,最后的返回值我们可以看最上面的那一行注释,它最后会返回一个最接近initialCapacity并且大于initialCapacity的2的次方的数,举个栗子,如果给定的initialCapacity是10,那么会返回16;如果initialCapacity是25,那么会返回32……

        那么问题来了,为什么要这样做呢?为什么不直接initialCapacity返回呢?

        这样做是为了在put方法中更快速地计算数组下标。

4、HashMap(Map<? extends K, ? extends V>)

        这个构造方法会把传进来的Map构造为一个新的HashMap,映射关系与原来的Map相同,底层数组使用默认负载因子(0.75)和足够容纳指定Map中的映射的初始容量创建。

三、HashMap中的put方法

我们来看一下源码中是如何建立key-vauel映射关系的:

它会首先计算key的哈希值,然后将哈希值,key,value传入putVal方法中。

追踪putVal方法:

内容有点多,我们逐条来看:

1、初始化底层数组为空的数组容量

        第一行定义了一个Node<K,V>类型的tab数组,p节点,和两个整型变量n、i。

        然后让tab指向底层数组table,判断tab是否为空,或者容量是否为0,满足以上条件之一,就会调用resize()方法对数组进行初始化容量的操作,然后再计算数组的长度。

        刚才无参的构造方法并没有初始化底层数组,那么我们追踪一下resize()方法,看一下最后会将底层数组的容量初始为多少。

追踪resize方法:

        也就是说,如果调用无参的构造方法后,第一次进行put操作时,会将底层的数组容量初始为默认的容量:16

2、插入元素

2.1 当前数组下标为空

        源码中计算当前key在数组中所属的下标是通过:(n - 1) & hash的方法,而不是用hash % 数组长度,它这样计算有什么好处呢?

        刚才分析构造方法时,我们知道,底层数组初始容量都是2的次幂,而2的次幂减1后的值,它的二进制的有效位全为1,在进行位运算时速度会更快一点,这也就是大佬们为什么在初始化数组时,初始容量给定为一个2的次幂数的原因吧~

        找到key所属下标之后,下标如果为空,那么直接将元素插入即可。

2.2 当前数组下标不为空

3、数组扩容

如果当前元素插入成功后,数组中的有效元素数量超过阈值,即插入该元素后负载因子会超标,就会再次调用resize方法进行扩容。