在多线程环境中,使用HashMap进行put操作时会引起死循环,导致CPU使用接近100%,下面通过代码分析一下为什么会发生死循环。
首先先分析一下HashMap的数据结构:HashMap底层数据结构是有一个链表数据构成的,HashMap中定义了一个静态内部类作为链表,代码如下(与本文无关的代码省略):
静态内部类entry代码
static class Entry<K,V> implements Map.Entry<K,V> {  
        final K key;  
        V value;  
        Entry<K,V> next;  
        final int hash;  
  
        /**  
         * Creates new entry.  
         */  
        Entry(int h, K k, V v, Entry<K,V> n) {  
            value = v;  
            next = n;  
            key = k;  
            hash = h;  
        }  
、  
    }/** * The table, resized as necessary. Length MUST Always be a power of two. */ transient Entry[] table;
之所以会导致HashMap出现死循环是因为多线程会导致HashMap的Entry节点形成环链,这样当遍历集合时Entry的next节点用于不为空,从而形成死循环
单添加元素时会通过key的hash值确认链表数组下标
Java
public V put(K key, V value) {  
    if (key == null)  
        return putForNullKey(value);  
      
    //确认链表数组位置  
    int hash = hash(key.hashCode());  
    int i = indexFor(hash, table.length);  
      
    //如果key相同则覆盖value部分  
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {  
        Object k;  
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {  
            V oldValue = e.value;  
            e.value = value;  
            e.recordAccess(this);  
            return oldValue;  
        }  
    }  
  
    modCount++;  
    //添加链表节点  
    addEntry(hash, key, value, i);  
    return null;  
}Java
void addEntry(int hash, K key, V value, int bucketIndex) {  
 //bucketIndex 通过key的hash值与链表数组的长度计算得出  
    Entry<K,V> e = table[bucketIndex];  
    //创建链表节点        
  table[bucketIndex] = new Entry<K,V>(hash, key, value, e);  
    
  //判断是否需要扩容  
  if (size++ >= threshold)  
            resize(2 * table.length);  
}  以上部分的实现不会导致链路出现环链,环链一般会出现HashMap扩容是,下面看看扩容的实现:
Java
void resize(int newCapacity) {  
        Entry[] oldTable = table;  
        int oldCapacity = oldTable.length;  
        if (oldCapacity == MAXIMUM_CAPACITY) {  
            threshold = Integer.MAX_VALUE;  
            return;  
        }  
  
        Entry[] newTable = new Entry[newCapacity];  
          
        transfer(newTable);//可能导致环链  
          
        table = newTable;  
        threshold = (int)(newCapacity * loadFactor);  
}下面transfer的实现
Java
void transfer(Entry[] newTable) {  
    Entry[] src = table;  
    int newCapacity = newTable.length;  
    for (int j = 0; j < src.length; j++) {  
        Entry<K,V> e = src[j];  
        if (e != null) {  
            src[j] = null;  
            do {  
                Entry<K,V> next = e.next;  
                int i = indexFor(e.hash, newCapacity);  
                e.next = newTable[i];  
                newTable[i] = e;  
                e = next;  
            } while (e != null);  
        }  
    }  
} 这个方法的目的是将原链表数据的数组拷到新的链表数组中,拷贝过程中如果形成环链的呢?下面用一个简单的例子来说明一下:
Java
public class InfiniteLoop {  
  
    static final Map<Integer, Integer> map = new HashMap<Integer, Integer>(2, 0.75f);  
  
    public static void main(String[] args) throws InterruptedException {  
  
        map.put(5, 55);  
  
        new Thread("Thread1") {  
            public void run() {  
                map.put(7, 77);  
                System.out.println(map);  
            };  
        }.start();  
  
        new Thread("Thread2") {  
            public void run() {  
                map.put(3, 33);  
                System.out.println(map);  
            };  
        }.start();  
  
    }  
  
}下面通过debug跟踪调试来看看如果导致HashMap形成环链,断点位置:
- 线程1的put操作 
- 线程2的put操作 
- 线程2的输出操作 
- HashMap源码transfer方法中的第一行、第六行、第九行 
测试开始
- 使线程1进入transfer方法第一行,此时map的结构如下 

2. 使线程2进入transfer方法第一行,此时map的结构如下:

3.接着切换回线程1,执行到transfer的第六行,此时map的结构如下:

4.然后切换回线程2使其执行到transfer方法的第六行,此时map的结够如上
5.接着切换回线程1使其执行到transfer方法的第九行,然后切换回线程2使其执行完,此时map的结构如下:

6.切换回线程1执行循环,因为线程1之前是停在HashMap的transfer方法的第九行处,所以此时transfer方法的节点e的key=3,e.next的key=7
Java
void transfer(Entry[] newTable) {  
        Entry[] src = table;  
        int newCapacity = newTable.length;  
        for (int j = 0; j < src.length; j++) {  
            Entry<K,V> e = src[j];  
            if (e != null) {  
                src[j] = null;  
                do {  
                    Entry<K,V> next = e.next;  
                    int i = indexFor(e.hash, newCapacity);//线程1等线程2执行结束后  
                                                          //从此处开始执行  
                                                          //此时e的key=3,e.next.key=7  
                                                          //但是此时的e.next.next的key=3了  
                                                          //(被线程2修改了)  
                    e.next = newTable[i];  
                    newTable[i] = e;  
                    e = next;  
                } while (e != null);  
            }  
        }  
}下面线程1开始执行第一次循环,循环后的map结构如下:

接着执行第二次循环:e.key=7,e.next.key=3,e.next.next=null

接着执行第三次循环,从而导致环链形成,map结构如下
 
并且此时的map中还丢失了key=5的节点
转载自:http://firezhfox.iteye.com/blog/2241043
