yiwangxi 如题,在我进行一项回顾性研究时,我在纳排标准中将因为同一原因重复就诊的患者作为排除标准,我认为同一患者因为同一原因多次就诊不属于独立事件,因此只纳入第一次的所有记录,在此基础上对患者的相关指标进行t检验、卡方检验、logistic回归;但审稿人认为不纳入重复就诊的患者属于根本的方法学错误,请教一下我的想法到底对吗?是不是需要修改为审稿人要求的重复就诊的患者也纳入进来然后再进行后续相关分析。
huyang yiwangxi 我个人是赞成你的想法的,我也认为同一个被试多次的数据是违背了样本独立性假设的,这个假设是常见统计检验所需要满足的,所以不能简单把一个被试的多次测量当成不同被试来处理。但是如果相当比例的被试都有多次数据,可以考虑进行一些预处理,比如把同一个被试多次的测量进行平均,从而获得更稳健的测量,或者可以使用更复杂的模型来做,这样充分利用数据信息。
hellowolrd 见多一些文章,大部分还是认为重复就诊是分开统计的,并且都会在基本资料里说明重复的有多大比例。 当然,这种情况是默认不同就诊点之间是独立发生,没有相关性的。 如果重复的特别多,会专门计算时间点的作用。
hellowolrd huyang 确实默认处理是当作独立的,显然这不符合实际。 问题是,通常医学样本量都很小, 其次,多时间点的纵贯数据,本来处理麻烦;比如常见做法是把各时间点都作为一个矩阵,即方差-协方差矩阵,或者说相关矩阵。 但这样做显然太复杂,过于计较数学模型,并不贴合实际。 比如医学上的回归,通常最多就2次项;要升级展开到100次项,虽然可以非常拟合,但没有任何意义! 所以,简单一点,还是按独立事件计算,同时补充说明重复人数即可。