cowboy313
对一个参数做100次估计(可认为是100个独立样本),每次都可以得到其估计值和其95%置信区间,且这个估计的结果符合正态分布,即这100次的估计值是正态分布。
如第一次估计得到:估计值x1, 95%置信区间[a1,b1]
第k次估计得到:估计值xk, 95%置信区间[ak,bk]
做完100次估计后得到结果为估计值X, 95%置信区间[A,B]
X等于x的平均,A和B怎么算,分别等于a和b的平均???
rtist
不是。直接平均的区间恐怕长得不必要了。
应该可以参照meta-analysis来做。
cowboy313
1楼可不可以说的明白一点,我是学工科的。
什么是长得不必要了?是否这个估计的区间可以更短一点,如果是,如何计算。那本书上或那个网址上有此方法?
计算估计值的均值X=(1/100)*sigma(x)这个没错吧,那么置信区间的两端是否也如此:
A=(1/100)*sigma(a)
或者是利用X的正态特性,由X的100个估计值来确定它的置信区间??
200422099
俺是学卫生统计学的,不是使用均数加减界值的T或U值乘以标准差吗?希望得到别人的知道,谢谢
oliyiyi
[quote]引用第0楼cowboy313于2007-07-12 09:59发表的“求助:参数估计置信区间设置问题”:
对一个参数做100次估计(可认为是100个独立样本),每次都可以得到其估计值和其95%置信区间,且这个估计的结果符合正态分布,即这100次的估计值是正态分布。
如第一次估计得到:估计值x1, 95%置信区间[a1,b1]
第k次估计得到:估计值xk, 95%置信区间[ak,bk]
.......[/quote]
同一参数的100次估计当作独立样本,很难说过去吧,难道使用不是同一批数据??
yihui
先要问一下,你做100次估计,每次估计的样本从何而来?Resample?
cowboy313
应该把具体情况说明一下。
我觉得如果是固定样本容量,假如为100。从无穷大的总体容量中抽出100个样本做实验,结果应该还不如做一次实验,单个样本容量的大小为100*100。
但是我这个问题具体:对某种生成方法的检测,假定是生成一个固定长度的泊松分布序列,设置参数lambda来检验这种方法。 对这种方法的评估即是假定每次设置生成的lambda的值为10,用另一种已有权威的方法来检测lambda的值,检测的结果一个区间估计。
如果我对这种生成方法运行100次,再作100次对lambda的区间估计,有100个估计的区间。又可以证明对lambda的估计值是正态的,如何根据这100个区间值的值来确定lambda的数据期望,以及以某种水平下的最短的区间?
rtist
就拿poisson来说吧:
let Y_ij be the ith observation from the jth simulated dataset, i=1,...,I, j=1,...,J.
You assumed Y_ij ~ i.i.d. Poisson(lambda)
Let Y_j be the sample mean from the jth dataset which is your estimate for lambda from the that dataset.
Then sum_j Y_j/J is the overall mean for all the IJ data points.
By CLT,
sqrt(I)(sum_j Y_j - J*lambda)/sqrt(lambda*J) ~ N ( 0, 1 ) for large IJ approximately.
Everything else is simple:
solve the equation for lambda
sqrt(I)(sum_j Y_j - J*lambda)/sqrt(lambda)/sqrt(J) = z(alpha/2)
where z() is the quantile function for standard normal distribution.
Note that dz/dlambda<0 and the solution is unique. After square both sides, and solving the quadratic equation,
The two roots are approximately the confidence limits with confidence coefficient 1-alpha, for large IJ .
Done!
上面的结果和你直接用所有的数据放在一起来估计的结果是一样的。
cowboy313
不明白七楼所讲。
生成一百次泊松分布,对每一次生成的数据只检测一次,因为检测方法是一个,你对这同一个数据集做多次检测的结果是一样的。
故可得一百个某水平的区间,如何由这一百个区间确定参数的均值和同一水平下的最短区间?
rtist
拜托你仔细看看好不好?难道我说的还不明白?
对波松分布来说,所有信息都在均值里面,一百个区间根本没用,有一百个点估计就足够把最后的区间找到了。
你把一百个点估计加起来,然后解一元二次方程就是最后的区间了。