"注意 XβX\beta 并不影响 yy 的方差" 这里的公式似乎编辑错了

大赞杨灿一如既往的好文!
11 天 后
好文。统计模型的妙处常常来源于在一个什么层面上去看待同样一组数据。在想要什么,和实际收集的是什么,以及最终能够得到的是什么之间,存在很大的想象空间。
我没有接触过生态学方面的数据。但就Genomics 的数据来看,比如Case-Control,response 是0-1的情况,LMM(Gaussian)是可以直接使用的,只要样本量比较大,比如>2000。如果是heave tail,通常需要做一些预处理,然后用LMM。
18 天 后
16 天 后
我没有用过OpenCV的实现,我个人喜欢GBM R package。当然Random Forest也是非常好的,也有R package RandomForest。
我个人觉得GB和RF效果实际上差不多,二者的主要想法互不相同却又互相联系,参见Friedman, J. H. and Popescu, B. E. "Importance Sampled Learning Ensembles." (Sept. 2003)。Re PS: 还是引用那句话吧:“你不觉得天边.的晚霞很美吗?只有看着她,我才能坚持向西走。”
10 个月 后
2 个月 后
膜拜大神,作为生物统计和计算基因组学新生,学到很多既扎实又很文艺的知识,谢谢大师。
4 年 后