海量数据的特征工程中,
如果数据特征维度达到几千乃至上万
常规的lasso很容易失效
这里介绍几种泛义lasso,是在实际数据处理中常用的
迭代与分块思路/分组的使用(有兴趣的同学可自行实践一下)
1. 迭代lasso
2. 分组/聚类lasso
3. 分组与降维结合lasso
另外在<<高维数据统计方法、理论与应用>> 一书中介绍了很多lasso方法,其中有广义group lasso的方法也很值得借鉴
如对本文有疑问, 点击进行留言回复!!
去 HBase,Kylin on Parquet 性能表现如何?
如何找到Hive提交的SQL相对应的Yarn程序的applicationId
如何在 HBase Shell 命令行正常查看十六进制编码的中文?哈哈~
网友评论