与容
我现在想分析要自然灾害造成的经济损失与灾害前的收入、灾害持续的时间、灾害的程度之间的关系。
我想将损失log化作为应变量,收入也log,时间根据四分位化成等级资料,程度也等级化作为自变量,采用多元线形回归。大家认为这样分析有什么不对的没?
现在还有几个其他问题如下:
1 灾害持续的时间:时间资料一般大家都认为是非正态分布的资料,除了四分位化等级有没有什么更好的方法
2 是否将损失与收入相除后用比值进行分析更好?如果这样做,将比值进行反正弦做为应变量,然后将时间和程度作为自变量,采用多元线形回归?
yihui
能不变换尽量不要变换,除非回归诊断有严重问题。这个取对数,那个反正弦(连这种变换都能想出来-___-//),到头来自己都不知道方程是什么意思了。
把连续数据转换为离散数据是更不可取的办法,损失信息。
要搞清楚回归究竟要求谁服从正态分布,不是自变量!
与容
[quote]引用第1楼谢益辉于2007-07-17 21:32发表的“”:
能不变换尽量不要变换,
把连续数据转换为离散数据是更不可取的办法,损失信息。[/quote]
1 在多元回归里的确不需要自变量和应变量是正态分布但是 残差要服从正态分布 这个怎么判断?
2 如果我将经济损失和遭受灾害的时间等资料全部不转换或分类的话,这样做是否合适? 有没有更好的模型?