groupby出来对象并不是dataframe,所以直接print是看不到矩阵或者高维矩阵的,所以需要用能够产生标量值的方法去处理groupby对象,这样可以利用矩阵形式处理高维数据;
这样groupby在产生标量值数据后就变成了dataframe对象,这个过程也可以用apply或者applymap完成,但生成标量数据的目的是不会变的,就是为了最终把groupby对象变为层次化索引对象;
层次化索引对象在标签使用上与低维的dataframe其实并没有很大差距,利用index属性可以得到multiindex对象,这里包含了levels,labels,以及names,这分别对应着索引值,索引是如何分布的以及索引本身对应的列名。这样可以用( . )调用multiindex内部的值,使用起来就很方便了,而且print之后还会有惊喜,里面甚至告诉了你数据类型dtypes和length,也就是一共有多少个。
如对本文有疑问, 点击进行留言回复!!
HBase Filter 过滤器之FamilyFilter详解
去 HBase,Kylin on Parquet 性能表现如何?
如何找到Hive提交的SQL相对应的Yarn程序的applicationId
网友评论