求助：参数估计置信区间设置问题

cowboy313

对一个参数做100次估计（可认为是100个独立样本），每次都可以得到其估计值和其95%置信区间，且这个估计的结果符合正态分布，即这100次的估计值是正态分布。

如第一次估计得到：估计值x1, 95%置信区间[a1,b1]

第k次估计得到：估计值xk, 95%置信区间[ak,bk]

做完100次估计后得到结果为估计值X, 95%置信区间[A，B]

X等于x的平均，A和B怎么算，分别等于a和b的平均？？？

rtist

不是。直接平均的区间恐怕长得不必要了。

应该可以参照meta-analysis来做。

cowboy313

1楼可不可以说的明白一点，我是学工科的。

什么是长得不必要了？是否这个估计的区间可以更短一点，如果是，如何计算。那本书上或那个网址上有此方法？

计算估计值的均值X=(1/100)*sigma(x)这个没错吧，那么置信区间的两端是否也如此：

A=(1/100)*sigma(a)

或者是利用X的正态特性，由X的100个估计值来确定它的置信区间？？

200422099

俺是学卫生统计学的，不是使用均数加减界值的T或U值乘以标准差吗？希望得到别人的知道，谢谢

oliyiyi

[quote]引用第0楼cowboy313于2007-07-12 09:59发表的“求助：参数估计置信区间设置问题”:

对一个参数做100次估计（可认为是100个独立样本），每次都可以得到其估计值和其95%置信区间，且这个估计的结果符合正态分布，即这100次的估计值是正态分布。

如第一次估计得到：估计值x1, 95%置信区间[a1,b1]

第k次估计得到：估计值xk, 95%置信区间[ak,bk]

.......[/quote]

同一参数的100次估计当作独立样本，很难说过去吧，难道使用不是同一批数据？？

yihui

先要问一下，你做100次估计，每次估计的样本从何而来？Resample？

cowboy313

应该把具体情况说明一下。

我觉得如果是固定样本容量，假如为100。从无穷大的总体容量中抽出100个样本做实验，结果应该还不如做一次实验，单个样本容量的大小为100*100。

但是我这个问题具体：对某种生成方法的检测，假定是生成一个固定长度的泊松分布序列，设置参数lambda来检验这种方法。对这种方法的评估即是假定每次设置生成的lambda的值为10，用另一种已有权威的方法来检测lambda的值，检测的结果一个区间估计。

如果我对这种生成方法运行100次，再作100次对lambda的区间估计，有100个估计的区间。又可以证明对lambda的估计值是正态的，如何根据这100个区间值的值来确定lambda的数据期望，以及以某种水平下的最短的区间？

rtist

就拿poisson来说吧：

let Y_ij be the ith observation from the jth simulated dataset, i=1,...,I, j=1,...,J.

You assumed Y_ij ~ i.i.d. Poisson(lambda)

Let Y_j be the sample mean from the jth dataset which is your estimate for lambda from the that dataset.

Then sum_j Y_j/J is the overall mean for all the IJ data points.

By CLT,

sqrt(I)(sum_j Y_j - J*lambda)/sqrt(lambda*J) ~ N ( 0, 1 ) for large IJ approximately.

Everything else is simple:

solve the equation for lambda

sqrt(I)(sum_j Y_j - J*lambda)/sqrt(lambda)/sqrt(J) = z(alpha/2)

where z() is the quantile function for standard normal distribution.

Note that dz/dlambda<0 and the solution is unique. After square both sides, and solving the quadratic equation,

The two roots are approximately the confidence limits with confidence coefficient 1-alpha, for large IJ .

Done!

上面的结果和你直接用所有的数据放在一起来估计的结果是一样的。

cowboy313

不明白七楼所讲。

生成一百次泊松分布，对每一次生成的数据只检测一次，因为检测方法是一个，你对这同一个数据集做多次检测的结果是一样的。

故可得一百个某水平的区间，如何由这一百个区间确定参数的均值和同一水平下的最短区间？

rtist

拜托你仔细看看好不好？难道我说的还不明白？

对波松分布来说，所有信息都在均值里面，一百个区间根本没用，有一百个点估计就足够把最后的区间找到了。

你把一百个点估计加起来，然后解一元二次方程就是最后的区间了。