sxcjwf
在计算生命表的时候,为什么要计算出死亡率,去估算死亡概率呢?书中说不知道死亡数dx和尚存人数lx,需要估计。
问题是要计算出死亡率,就得知道x岁年龄组的死亡人数dx,知道了dx,就可以通过一步步累加得到各年龄的尚存人数lx,这样不就可以编制生命表了吗?即使不去计算那个死亡概率,大不了我用dx之和作为L0,而不用去设定成100000,不就能编制生命表了吗?
清各位前辈帮忙解答一下。
kimboo
生命表是一种采用非参数方法估计生存函数S(x)的方式。的确,如果累加x年后的所有dx,就可以得到lx,进而得到每年的死亡概率。如果没错的话,实务中也应该是这么估计的。但是实际生命表中通常采用100000作为基准人数,我想这是因为方便数据展示的缘故,如果基准人数L0太少,比如1000,那么年死亡人数岂不是要有很多位小数?那么你四舍五入到哪一位才合适呢?而基准人数太大又没有必要。不知道回答楼主的问题了没。
sxcjwf
非常感激版主的回答,关于基准人数我能够理解。能否再进一步解释,我只要知道了年度的死亡数据,就可以编制出生命表,但书中为什么搞的很复杂?它们的区别在那里?
kimboo
不太清楚你用的是哪本书,‘不知道死亡数dx和尚存人数lx,需要估计’我也不太清楚指的是什么,不过如果要构建生命表,dx应该是基础。
sxcjwf
我想问:“dx应该是基础”,在实际中我们是知道这个dx的,就只从dx我们就可以编制出生命表来,这不很简单的事情吗?为什么几乎所有的书把生命表的编制搞的很复杂?
谢谢版主关注我这个问题,这个我想了很长时间,不明白,希望大家能给了解释。 [s:15]
kimboo
其实生命表的编制的确很复杂,因为它要基于一定的假设,将调查的横向数据转化为纵向的数据,还要做尾部修正。但是如果dx已经计算得出,生命表实际上就已经形成了,所以dx其实是生命表的基础,接下去的事情就是求出每一年的死亡率,然后令初始人数为100000,这其实是一个标准化过程,本质是每年的死亡概率。
sxcjwf
我觉得,接下来的事情都不用求出每一年的死亡率,和死亡概率。
接下来把dx各年累加得到Lx,之和是L0
生存人年数Yx=(Lx+Lx+1)/2(时间长度是1年,所以用这个公式就很简单)
把Yx再累加就得到总的存活人年数Tx
最后把Tx除以Lx就得到平均预期寿命,这个生命表就编完了。
生命表没有说L0必须是多少,哪我选择L0是dx之和,也未尝不可,哪这岂不很简单!?
kimboo
不同生命表采用的样本量是不同的,为便于比较,还是采用相同基数比较好。
其实我个人也认为采用什么L0并不本质。 [s:11]
yinjisheng
关键是各年dx数据的得出啊,这个出来了其他的当然都简单了啊,qx,px不用算都出来了