sizheng
问题描述:
一个样本空间,比如0-2^32-1,即32位无符号整数空间,其中实际存在的有效值有若干,比如15%,并且分布是不均匀的。
为了对这15%的有效值进行采样,采用拒绝-接受采样法,即随机生成一个整数进行测试,如果存在,则命中,否则不命中。
为了提高采样效率,将样本空间均匀划分成N个区间,然后根据各个区间的命中率调整在各区间的采样概率,这样的话,有效值密集的区间命中率就会高,也就更多地在该区间采样。
考虑两种极端情况,一种是N=1,一种是N=2^32,这两种极端情况实际上都已经退化为在整个样本区间的随机采样,那么我们认为N应该有个较为合适的值,使得整体的平均命中率比较高。
想来应该是整体平均命中率的期望值E(P)应该是与N相关的函数,然后该函数导数为0的点就是极值点。直觉上觉得是这样,但是具体的分析、推导应该是怎样的呢?
求教!