把数据格式稍微处理一下,就可以glm算logistic回归了。
<br />
library(plyr)<br />
mydf = read.table("tmp.txt", head=TRUE)<br />
newret = ddply(mydf, .(Coffee, Sex), function(x){x[order(x[,1]),4]})<br />
newret$Coffee=factor(newret$Coffee)<br />
newret$Sex=factor(newret$Sex)</p>
<p>ret.glm=glm(cbind(V1, V2)~Coffee+Sex+Coffee*Sex, data=newret, family=binomial)<br />
print(summary(ret.glm))<br />
</p>
结果发现,没有交互效应,没有性别差异,
如果你数据项Case里面0代表健康,1代表发病。那么咖啡是发病的保护因素(P<0.05);喝咖啡居然可以预防疾病!![s:14]
当然,你也可以选择说:咖啡和疾病没有太大关系,因为P>0.01。[s:11]