wwenjuan
如果我对一组数据做拟和得到一个拟和式(不是其密度函数);现在又反过来做这组数据和这个拟和式的k-s检验的话.是不是没什么意义!
例如我的数据是x=[1 2 3 4 5 6 7 8 9 10];
y(x)=[3716 1763 1273 945 639 484 383 277 264 172]
做拟和得拟和式y=4508.2*x.^(-1.2913);
我是这么做k-s的:
(1)先根据x及拟和式求出一组y值;
(2)将我实验的y与求得的做spss的两独立样本k-s检验;
结果z=0.224,p=1
我觉得这么做好象没意义!
不知是不是这样!
那具体应该怎么做呢!是先求出这组数据的分布函数吗?
请各位高手指教下!谢谢!
yihui
不妨称之为“依瓢画葫芦”。
wwenjuan
谢老师说话总是这么简洁!呵呵!
可能是我太笨,不是很明白!麻烦您能说的详细点吗?谢谢了!
yihui
你先依照葫芦画出了瓢,然后又回过头看瓢和葫芦是不是一样的。
知道KS检验是检验什么东西的么?这个检验的条件是什么?(独立当然是必要的条件,不过你可曾想过y和y-hat是否独立?答案显然是否定的,因为线性回归中,估计值y-hat是y的线性组合)
wwenjuan
对呀!确实是“依瓢画葫芦”,呵呵!
那我现在就有两个问题还是想请教下:
(1)既然y和y-hat不独立,那么我用y-hat求得的密度函数也应该是不独立的了?
(2)我是想检验下我的拟和式做的好不?既然不能用k-s了,该用什么方法做?
总的来说,我就是想得到一个描述我的数据的模型(我是通过先拟和数据,再求出它的密度函数这么做的,不知有什么问题没),当然模型好坏想做个检验,就是不知道该怎么检验.
数学真是太差了,要用才发现真该好好学习下数学,尤其是概率与统计!!!!!!!
yihui
(1)什么叫“y-hat求得的密度函数也应该是不独立的”?独立是针对随机变量来说的,函数独立是什么意思?
(2)拟合好不好,核心在于残差(要是完全拟合,残差就该为0了),一般不都是R-square么。当然还有其它指标。
wwenjuan
因为虽然我主要是想得到这组数据的一个经验的分布;而不仅仅是它们的拟和式!所以我不可以单单看拟和的好坏,还要看我得到的经验分布好不好!
比如现在我这组数据,粗看好象是一个幂函数式,用幂函数拟和这10个数据也很好!象这里我得到
y=4508.2*x.^(-1.2913)这样的拟和式.其中x是长度;我的数据其实还有长度大于10的部分(可以说理论上长度是无限大的);总体的规律是一个幂函数.我想通过前10个做出一个经验的分布来描述整个数据的规律.
wwenjuan