当前位置: 移动技术网 > IT编程>开发语言>Java > Java 集合类Hashmap

Java 集合类Hashmap

2019年02月18日  | 移动技术网IT编程  | 我要评论

一.hashmap 简介

hashmap在程序员的开发过程中是一个十分常用的集合类,它是一个以键值对形式存在的集合类,

在开发中我们可以利用的它的一个key存在即替换的特性,实现一个更新的去重的操作。

在另一个方便我们可以利用map跟fastjson快速组成我们所需的json数据格式。

在jdk1.8之前,hashmap是以数组+链表的形式存在,put进来的key的hashcode进过扰动函数计算后得到hash值,然后该值通过(n-1)&hash计算后的到相应的位置(n代表的是数组长度),

如果发生了hash冲突,则先判断该key是否存在,如果存在那么就覆盖,否则以“拉链法”解决冲突,便组成了链表。

但在jdk1.8之后,hashmap就发生了改变,如果当前链表的长度大于阈值(默认是8)那么该链表就转换成红黑树,加快了搜索速度。

 

二.hashmap属性

//hashmap的默认初始容量 2^4=16
static final int default_initial_capacity = 1 << 4; // aka 16

//hashmap的最大容量
static final int maximum_capacity = 1 << 30;

//默认的装载因子当数组长度
static final float default_load_factor = 0.75f;

// 当桶(bucket)上的结点数大于这个值时会转成红黑树
static final int treeify_threshold = 8;

// 当桶(bucket)上的结点数小于这个值时树转链表
static final int untreeify_threshold = 6;

// 桶中结构转化为红黑树对应的table的最小大小
static final int min_treeify_capacity = 64;

// 存储元素的数组,总是2的幂次倍
transient node<k,v>[] table;

// 存放具体元素的集
transient set<map.entry<k,v>> entryset;

// 存放元素的个数,注意这个不等于数组的长度。
transient int size;

// 每次扩容和更改map结构的计数器
transient int modcount;

// 临界值 当实际大小(容量*填充因子)超过临界值时,会进行扩容(*当size大于等于threshold的时候,并不一定会触发扩容机制,但是会很可能就触发扩容机制,只要有一个新建的entry出现哈希冲突,则立刻resize
int threshold;

// 填充因子 当size>=threshold的时候,那么就要考虑对数组的扩增了,也就是说,这个的意思就是 衡量数组是否需要扩增的一个标准
final float loadfactor;

三.hashmap的扩容机制

 public hashmap(int initialcapacity, float loadfactor) {
        if (initialcapacity < 0)
            throw new illegalargumentexception("illegal initial capacity: " +
                                               initialcapacity);
        if (initialcapacity > maximum_capacity)
            initialcapacity = maximum_capacity;
        if (loadfactor <= 0 || float.isnan(loadfactor))
            throw new illegalargumentexception("illegal load factor: " +
                                               loadfactor);
        this.loadfactor = loadfactor;
        this.threshold = tablesizefor(initialcapacity);
    }

 其中tablesizefor这个代码是:

static final int tablesizefor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= maximum_capacity) ? maximum_capacity : n + 1;
    }

>>>是一个无视符号位的位右移动符号  |= 是左右两个数进行&操作

这个方法会把你传进来的初始化容量变成一个是2的平方次幂的数 所以这里就固定死了hashmap的容量必须是2的平方次幂

至于为什么是2的平方次幂的数原因如下:

1.put方法源码:

final v putval(int hash, k key, v value, boolean onlyifabsent,
                   boolean evict) {
        node<k,v>[] tab; node<k,v> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newnode(hash, key, value, null);
        else {
            node<k,v> e; k k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof treenode)
                e = ((treenode<k,v>)p).puttreeval(this, tab, hash, key, value);
            else {
                for (int bincount = 0; ; ++bincount) {
                    if ((e = p.next) == null) {
                        p.next = newnode(hash, key, value, null);
                        if (bincount >= treeify_threshold - 1) // -1 for 1st
                            treeifybin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                v oldvalue = e.value;
                if (!onlyifabsent || oldvalue == null)
                    e.value = value;
                afternodeaccess(e);
                return oldvalue;
            }
        }
        ++modcount;
        if (++size > threshold)
            resize();
        afternodeinsertion(evict);
        return null;
    }

看到其中 p = tab[i = (n - 1) & hash]) == null  这一句   (n - 1) & hash是计算到一个位置,如果这个tab中的位置是空的那么直接做插入操作。

举个列子   假设有16个位置    有4个学生都有各自的学号

名称 学号
张三 1
李四 2
王五 3
老李 4

 

 

 

 

此时我们分配位置的时候可以采用  1%16 = 1;2%16=2;3%16 = 3;4%16=4;给他们分配位置,但是考虑到性能问题。由于%操作比&慢10倍左右,因此采用&运算会提高性能。

通过限制length是一个2的幂数, (n - 1) & hash和hash%n结果是一致的。这就是为什么要限制容量必须是一个2的幂的原因。

比如2的hashcode是2   那么它对应的二进制是 (0000 0010)

假设n=16

那么n-1=15对应的二进制是  1111 1111 & 0000 0010 = 1111 1111 = 0010 = 2

2%16=2

得到(n - 1) & hash和hash%n结果是一致的,考虑到性能所以每次的扩容都是以2的幂次方扩容。

四.hashmap的简单应用

public  static void mapmethod() {
		hashmap<string, object> map = new hashmap<>();
		map.put("zhangsan", 11);
		map.put("lisi", 11);
		//重复key会覆盖
		map.put("zhangsan", 22);
		//便利
		for(string key:map.keyset()) {
			//根据key获取value
			system.out.println(key+"=======value:"+map.get(key));
		}
		//containskey方法判断当前map是否包含该方法
		system.out.println(map.containskey("zhangsan"));
		//size打印map的长度
		system.out.println(map.size());
		//移除key
		map.remove("zhangsan");
		//判断是否存在value
		system.out.println(map.containsvalue("22"));
	}

五.总结

以上是我结合工作跟一些blog的心得写的,如果有纰漏麻烦指出. *程序员要多运动啊....减肥去了

 

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网