caicai01
正在做一个多元线性回归模型,但是因变量是非正态的数据,右偏。
请教有什么比较方便的办法?
我已经尝试了log,ln,1/y等等方法;但效果都不好,哪位大虾有别的方法?
有没有用过约翰逊的分布体系来转化的?可否介绍介绍?
caicai01
怎么没有人帮忙回复啊!
自己顶一下先!
cran
sqrt,forth root
losttemple
试试box-cox变换
neige
transformation 要适可而止,do not play with the data for too long
yihui
严重同意楼上。因为统计不是仅仅为了拟合模型,等你把数据变换得一团糟时,也许满足了数理统计的种种假设条件,但解释起来就太困难了。
longoR
实际上,常见的数据变换,比如开根号、取对数、box-cox等等,背后都有特定的模型在支持(最常见的就是variance is some power of the mean模型)。transformation本身就是在更换统计模型,所以那还不如就直接给数据更合适的模型。
transformation经常会改变很多性质,比如原来线性的关系,变换之后就失去线性了,是正态的又能怎么样?不是照样还不能用多重回归么?所以transformation的成功率通常不是很高。远不如有什么问题就更改模型的哪个方面来针对性地解决什么问题。
变换顶多在模型又多各方面的问题,且一个简单的变换可以解决多个问题的时候才有价值。
最后一点,和楼主的问题有联系的,就是多重回归中需要的是误差的分布为正态,而不是数据分布为正态。变换通常都是在数据上进行的,所以把数据变正态了,误差可能反而不是正态了,得不偿失。