cacaucenturion 比如说,我有1000个实验对象(比如1000个学生),其中300个阳性结果,我想按照这1000个实验对象的某一个共同属性值(比如说身高)作为X轴,以阳性结果的密度作为Y轴,做一个平滑的曲线图。我该怎么做才好呢? 是不是可以设一个sliding window,估计每一小段区域的身高内的密度,再连成曲线? 多谢啦!
doctorjxd 回复 第1楼 的 cacaucenturion: 计算概率,及自动平滑的工作交给计算机来做, 在R里面,直接上高端大气的“广义可加模型”: <br /> library(gamlss)<br /> #假设数据中是否阳性(0,1)存在y中,身高存在x中<br /> ret = gamlss(y~cs(x), family=BB)<br /> termplot(ret)<br /> 纵轴是logis值,可以用 plogis 函数转为概率 </p>
doctorjxd 回复 第4楼 的 cacaucenturion: 紧急更正:predict 的结果,可以用plogis函数转化为概率,而不是我原来说的pnorm函数。 今天才看到BB分布的默认link函数是logit。[s:12]