大家好,我目前有一些关于bayesian informative priors的问题,其中一些可能比较幼稚,还请不吝赐教。
问题本事是关于computational statistics的,所以有些地方并不严谨。
- 假设已知了一个问题里最优参数值,记为
\(\theta_0\)
;
- 通过样本求出的MLE比
\(\theta_0\)
大;
- 我希望通过贝叶斯得到的MAP估计可以尽可能接近
\(\theta_0\)
;
假如参数只有一个,也就是说我们希望prior的作用是把MLE往左边“拉”一段距离。
第一个问题是:由于我想要得到一个适用性很好的Prior(logprior)distribution,所以我令logprior中系数的大小和样本本身的数量级和长度(也可能还有其他的信息)有关。假设一个logprior是
$$LP(x) \propto ax$$
然后根据我的假设,这个logprior就会变成
$$LP(x) \propto c*p*x$$
where c is a constant and p is a number decided by our sample.
根据先验分布的定义,它是不能含有样本数据的信息的,只是我们事先有一些历史数据,然后根据这些历史数据我们有一个关于参数分布的假设。那么现在我这么处理prior是否合理?
第二个问题,我上面已经提到我希望得到一个适用性很好的先验分布,换句话说我希望我的Prior作用在不同数据集的时候都可以得到/接近我想要的结果。那么为了得到这个先验分布,我们需要确定:
- 如何选择先验分布;
- 如何更合理地定义p;
- 如何对c进行取值
假设我们解决了前两条,即我们知道先验分布以及p,为了确定常数c的大小,我的想法是定义一个loss function,然后对不同的c, 计算在10个simulated datasets上的error,取normalized sum最小的对应的c作为最优值。不知道我这个想法是否合理?
第三个问题,有没有哪位大佬处理time series关于seasonal adjustment的问题,具体来说是用state-space model 来做不是ARIMA/SARIMA的?
问题可能一时说不清楚,有兴趣的请留言。