wuxuetianzi 本人不是学统计的,但是最近获得了一些数据需要处理并获得回归方程,因此需要向各位求助,谢谢! 数据情况如下: 一批20个长50厘米,直径1厘米的圆柱,每根圆柱上由一端到另一端都标注了等间距的20个监测点,经过一系列处理后,在每个圆柱的同一个监测点上可以测得这个监测点的硬度,密度和温度,因此通过每个圆柱都能获得20组包含硬度,密度和温度的数据。现在希望通过这20x20组数据,获得以硬度为因变量,密度和温度为自变量的回归方程。但是,不仅仅两个自变量(密度和温度)之间呈现多重共线性,而且每一个观测点的硬度不仅仅取决于这个观测点上的温度和密度,还取决于这跟圆柱上所有观测点的密度和温度。举例而言,在1号圆柱上的1号观测点的硬度不仅仅与1号监测点上的密度和温度相关,还与1号圆柱上剩余的19个监测点的密度与温度相关。 请问在这种情况下,应该用什么方法才能够得到准确的回归方程? 谢谢!
nan.xiao 来个简单的频率派答案就是 linear mixed effects model。在这个框架下可以把线性模型建到相当精细的程度。 不过这同时是个坑,因为需要自己指定的东西比较多,要把这模型建好,可能还真得学统计的人来。
nan.xiao 存在非线性关系很正常,那就是 nonlinear mixed effects model。 楼上两位的回答从技术上说也许可行,但是对楼主的问题来说可以说并不是很适合,所以在这里实名反对一下 …… 😅
nan.xiao @wglaive mixed model 提供了一个典型的框架,可以比较体面地解决这种存在 mixed effect 的问题。但反之我觉得并不成立:并不是说因为数据中有这样的关系就必须用 mixed model 解决 —— 尽管 mixed model 在这种情况下属于非常值得尝试的一类模型。