注:你可以把我下面的话都当成胡扯……
我对你所谓的“纠偏”的理解是,怎样才能把实测数据变成跟标准数据一样。
那么在解决这个问题之前,先得问一句,实测数据和标准数据真的不一样吗?
零假设:如果忽略噪声,那么实测数据和标准数据是一样的。
实测数据=标准数据+噪声
也就是说
实测数据=0+1*标准数据+噪声
也就是说
(实测数据-标准数据)=0+0*标准数据+噪声
那做个回归看看呗:假设你一楼的数据集是a,那么
lm((X3-X2)~X2, data=a) %>% summary
回归结果是:
Call:
lm(formula = (X3 - X2) ~ X2, data = a)
Residuals:
Min 1Q Median 3Q Max
-0.40292 -0.10357 -0.00292 0.09193 0.40738
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.17245 0.07562 2.28 0.0248 *
X2 -0.02575 0.02408 -1.07 0.2876
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1708 on 94 degrees of freedom
Multiple R-squared: 0.01202, Adjusted R-squared: 0.001513
F-statistic: 1.144 on 1 and 94 DF, p-value: 0.2876
可见标准数据和实测数据之间的差异,跟标准数据已经没有什么关系了(p=0.2876);但是这个差异还不能说基本上就是0(p=0.0248),均值为0.17245,可能有轻微地、系统性地高估。
那么把这个系统性偏差修正掉:
lm((X3-X2-0.17245)~X2, data=a) %>% summary
结果是:
Call:
lm(formula = (X3 - X2 - 0.17245) ~ X2, data = a)
Residuals:
Min 1Q Median 3Q Max
-0.40292 -0.10357 -0.00292 0.09193 0.40738
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.997e-06 7.562e-02 0.00 1.000
X2 -2.575e-02 2.408e-02 -1.07 0.288
Residual standard error: 0.1708 on 94 degrees of freedom
Multiple R-squared: 0.01202, Adjusted R-squared: 0.001513
F-statistic: 1.144 on 1 and 94 DF, p-value: 0.2876
此时关于截距和斜率的两个零假设都不能被推翻。
亦即没有统计意义上的证据可以说,修正后的实测数据和标准数据有什么区别。