- 头两本倒是都有,不过不是电子版。其实第二本世图已经出了,人民币29元,网购更便宜。
- 关于R-N导数:
m(A)是A的广义测度(度量),就像A的面积一样。能不能通过一个函数在A上关于P的积分计算呢?如果能,这个函数就叫做m关于P的R-N导数。换句话说,广义测度m通过这个函数利用测度P表示出来了。这和数学分析里的导数异曲同工,在那里变上限定积分表示的面积函数是通过面积函数的导数对自变量的积分表达的。 - 先说一种理解:
E(X|Y)是这样一个东西:利用Y来估计X,那么这个估计就应该是Y的函数,而且是所有Y的函数里最好的一个,所谓最好,是指它与X的均方误差最小。E(X|Y)就是这样的估计,即对任意Y的函数g(Y),E(X|Y)满足
E(X - E(X|Y))^2 <=E(X - g(Y))^2.
抽象点说,Y的所有具有二阶矩的函数(要求是波雷尔函数)全体构成L2空间,是希尔伯特空间(就像你学过的欧几里德空间一样),而E(X|Y)就是X在这个空间的正交投影,它与X之间的距离是最小的。
注意,这种理解哪怕Y是多元都可以,例如Y是样本。但是需要X的方差存在。
第二种理解,用R-N导数理解:利用Y可以确定的所有事件全体构成一个事件域G。
G中的任意事件A发生的时候,X 的平均值(即X在A上的积分),能不能用一个只与这个事件域G有关的随机变量(即G可测随机变量)在A上的平均(即它在A上的积分)计算呢?能!具有这种作用的这个只与事件域G有关的随机变量就是 E(X|Y)。
怎样找到这个随机变量呢?
对任给G中的事件A,X在A上的积分记作m(A),那么m是事件域G上的广义测度。而事件域G上还有原来的概率测度P。m关于P绝对连续,当然就有m关于P的R-N导数,是G可测函数,这里就是Y的函数,它在任给A上的积分与X在A上的积分(即平均)相等。所以这样找到的R-N导数就可以作为E(X|Y).
对于第二种理解,起关键作用的是事件域G,要求E(X|Y)必须是G可测的(这里就是利用Y可表达的)。所以按本意E(X|Y)应该写成E(X|G),只要有事件域G,就可定义E(X|G)。
一般地,E(X|G)是利用G里面的事件刻画X的一个最好的随机变量,即G可测随机变量里与X最接近的一个;作为特例,E(X|Y)是利用Y的函数刻画X的最好的随机变量。
(“最好”的意义:它在任给G中事件A上的均值(即在A上的积分)与X在A上的平均(即在A上的积分)相等。
在X的方差存在时,等价于均方误差最小,即对任意G可测随机变量Z都有E(X - E(X|G))^2 <=E(X - Z)^2.)
两种理解一个来之分析,一个来之几何。在X的方差(或者说是2阶矩)有限的情况下两者汇合了。 - 和事件发生(即至少有一个发生)的概率不超过各事件发生的概率的和。
- 什么是统计?这个概念在中国的意义和国际潮流之间有巨大出入!统计局现在做的事情只是统计的极其有限的部分。
从数据到结论,这才是统计。至于是怎样做的,那正是统计学家要研究、创造的地方。可能是已有方法的巧妙应用,也可能是新理论新方法的提出。所以,统计学者榜可能会包括这样的两类人。不管哪类人,在统计学上做出成绩时,一定不会受既定环境的影响,他的理论或结果不是为了支持某个论点,而是利用自己的结果提出某个论点或观点。
那么,我们先列列目前有哪些值得骄傲的统计成果吧!有了值得骄傲的成果榜,统计学者榜就自然出来了! - Multiple Regression 多元回归(与一元回归对应),响应变量Y(因变量)一维,回归变量(自变量)至少两个。
(A Regression giving conditional expectation values of a given variable in terms of two or more other variables.)
multivariate regression 多变量回归,响应变量Y(因变量)至少二维。 - 作者后记里提到的那几本书其实都非常精彩,基本都看过了。还有许多故事可能是出于篇幅所限没有写进来。
Constence Reid写的Hilbert传记之类的确好看,那本关于统计巨匠奈曼的传记也是她写的吧,值得学统计的人一看。
胡作玄的《布尔巴基学派的兴衰》也非常不错。 - 1、EX(0)=0,E{X(0)^2}=0 推出X(0)=0 a.s. 所以起于0点没有问题了。
高斯过程表明有限维分布是正态的,只需要确定期望和协方差即可。以下都会用到这一点。
2、期望为0,方差为D{W(t)}= E{X(t)^2}=t。所以W(t) ∼ N(0, t ), ∀t > 0。(纠正一个你的错误,这不是标准正态)
3、D{W(t) −W(s)}=0也不难算出来,所以 W(t) −W(s) ∼ N(0, t − s), ∀t > s , 这就说明了平稳增量性。
4、E(W(t1) −W(s1))(W(t2) −W(s2)) = t1 − s1 − (t1 − s1)= 0, ∀s1≤t1 ≤ s2 ≤ t2. 而 Gauss 系中有限个随机变量之间的独立性与不相关性等价,所以对任给 s1 < t1 ≤ s2 < t2 ≤...≤ s, W(t1) − W(s1),W(t2) − W(s2), ... ,W(tn) − W(sn)相互独立。
OK? - 有限维分布是多元正态,矩条件保证了有平稳性,独立增量性
- 关于1楼和5楼的问题:首先,4楼没错,可测集的确和罗素悖论无关。但是说到勒贝格可测集,那就有一定的关系了,因为这时讨论的是实数集的性质了。
其次,5楼所说的那个问题,即使排除了不男不女,X={男,女}也不是你要讨论的样本空间。否则的话,你的F中的{男男}就不是X的子集了,怎么会是事件呢?
你的问题的样本空间是Ω={全体男人和女人},是个有限集,其对应的事件域取F={Ω的子集全体}完全可以,(Ω, F)就是可测空间。你说的性取向问题对应的F上的概率测度P是未知的,需要用统计方法确定。更常见的做法是在(Ω, F,P)上定义一个随机变量,用统计方法确定随机变量的分布而不是P本身。例如任取ω∈Ω,定义
X(ω)=0,若ω是和尚,
X(ω)=1,若ω是尼姑,
X(ω)=2,若ω是丈夫,
X(ω)=3,若ω是妻子,
X(ω)=4,其他。
再定义
N(ω)=-1,若ω是情人中的男子,
N(ω)=1,若ω是情人中的女子,
N(ω)=0,其他。
这样的话,你说的那些事件就可以用随机变量表达清楚了。例如
A={X=0}就是和尚的全体,B={1<X<4}就是夫妻全体,C=(1<X<4或N不等于0)就是夫妻或情人全体,等等。如果你觉得还不过瘾,可以再定义一个随机变量Y,例如当ω是3P爱好者时,Y(ω)=-1,否则Y(ω)=1。还可以定义Z(ω)=-1,若ω是男性,否则Z(ω)=1,又一个随机变量。这时Ω的子集{Y=-1,Z=-1}当然还是F中的元素,所以是事件,表示什么你应该能看懂了。你的任务就是用统计方法搞清楚X,Y,Z,N的分布甚至联合分布。
当然你也可以不引入随机变量,直接估计个别事件的概率,但是如果要做区间估计或假设检验这样的事,最终你必将和某个或某些随机变量发生关系。
你完全可以只取Ω的部分子集作为σ域子,例如和尚全体A,尼姑全体B,丈夫全体为C,妻子全体为D,男同性恋全体E,女同性恋全体F,将这些集合及其这些集合的交,并,补等放到一起构成一个σ域F' 来研究,这时(Ω, F' )是可测空间,但是这不能保证你可以在(Ω, F' ,P)上定义足够多的随机变量。总之,σ域要大到将你感兴趣的所有事件都包括进去且满足基本数学要求。
数学概念是不容有半点含糊的,样本空间就是一个集合,事件必须是其子集。反之不然。再举一例:
掷一颗骰子,则可取Ω={1,2,3,4,5,6}, F为其子集全体,F把你能考虑到的事件都包括进去了。定义X=1,2,3,4,5,6对应相应的点数,则(Ω, F)是一个可测空间,X是(Ω, F,P)上随机变量,例如A={X<4}表示点数不超过3这个事件。用统计方法搞清楚X的分布,就搞清楚测度P了。如果要考虑点数不超过3时甲赢,否则甲输这样的问题,定义Y=1,若点数为1,2,或3;否则Y=-1,则Y也是随机变量。搞清楚Y的分布就是你的任务了,不一定要求出概率测度P。当然能求出来最好。
这时其实你可以取事件域F' ={{1,2,3},{4,5,6},Ω,Φ},当然这个事件域比F小多了。(Ω, F' )也是一个可测空间,但是你不能在(Ω, F' ,P' )上定义足够多的随机变量。例如上面那个X就不是这个概率空间上的随机变量,比如{X<5}就不是F'中的元素,故X不是随机变量。但是Y显然在这里还是随机变量。当然这个P'也不是那个P了。不过这对你的问题已经足够了。
可测空间取多大?依问题需要和数学要求而定。 空间往往是带有一定结构或运算的集合,而不是简单的集合。例如,
1、在集合X中的任意两个元素x,y之间定义距离d(x,y),d满足距离概念的基本要求,那么(X,d)这个二元组就叫做一个距离空间。有时候简称X为距离空间,但不能忘了那个d;
2、将集合X的一些子集放到一起记做O,要求O里的元素满足一定的条件,例如对有限交和任意并封闭,包含X和空集,那么(X,O)叫做拓扑空间,O里的元素叫开集。这是学习概率论的必备空间;
3、如果在对X中元素之间定义了顺序关系<,满足一定的要求,例如传递性等,那么(X,<)叫序空间。
4、定义了代数运算的集合叫代数空间;
等等。数学的每个分支基本上都是在某个空间讨论问题,而不是一个孤零零的集合。
什么是可测空间呢?正如你所说,就是那个二元组(X,F)。但是记住F只要满足三个条件就可以了,这样的话我们就可以对F中的元素定义测度了,所以F中的元素叫可测集。
但是这时许多人会犯一个致命的错误,认为对F加了限制,排除了一些不可测集。其实我们可以取F为X的子集全体,这时(X,F)就是一个可测空间,我们可以给F中的元素定义测度。
问题出在哪里呢?把可测空间和测度空间的概念混淆了,出在“定义测度”这个步骤!定义了测度(例如记做m)的可测空间叫测度空间,记做(X,F,m),是个三元组。
F取得太大,可能导致无法定义合适的测度。例如取R的全体子集作为F,那么我们没有办法将区间长度这个合适的测度概念定义在F的每个元素上,F太大了。缩小F为小一点的σ域F',使得F' 包括所有的区间,而且其中的元素都有测度L,而且L是区间长度概念的自然推广,就得到所谓勒贝格测度空间(R,F',L),F' 中的元素叫勒贝格可测集,而相应的测度L叫勒贝格测度。
所以可测空间中的可测集和测度无关,测度空间中的可测集和测度有关。
概率论研究的概率空间就是一个测度空间(X,F,P),其中P是定义在F中的测度,叫概率测度。集合X我们一般叫做样本空间,F中的元素叫可测集,但是我们更愿意叫做事件,而把F叫做事件域。任取F中元素A,它是X的子集,这时是一个事件,它的测度P(A)就是事件A的概率。可见这三元组(X,F,P)中的东西缺一不可。- 挺好的东西
- 看看再说
- 于 求教高人期望问题你说错了,Uj是(0,1)均匀分布才对,而且t在(0,1)上取值。否则该式不对:
E( z^ I [o,t] (Uj) )= z^ I [o,t] (u)在(0,1)上对u积分
=z在(0,t)上对u积分+1-t
=zt+1-t - 于 统计人的悲哀其实做一个工资收入分布曲线不难,有兴趣的话大家不妨自己调查一下做一个。我做过人均国民生产总值的分布密度曲线(以各地数据为样本)。那是严重的偏态分布,严重左偏而且右尾极薄。不过其实统计局应该早有人做了,只不过作为内部资料不公布罢了。但是大家做统计,可以自己做一下。
- 于 统计人的悲哀“平均”最常用的实际上有三种意义,那就是算术平均,中位数,众数。说到工资,对我们国人来说,中位数和众数才是更关心的。道理都知道,但是没有人敢轻易公布。
- 与体制有关,人为制造了许多看似很专业的领域,事实上禁锢了学界的思想和工作的交流。
有时候人们认为专家就该专,从高中就开始专了,其实是大错特错!
事实上专业教育应该是从博士开始。我们还没有意识到这一点,目前的这种状况恐怕难以在短期内改变。
现在我们的许多所谓大学专业课,实际上是基础课,不应该拉大旗作虎皮吓唬学生,而是放下架子面向所有愿意学习的学生。这给我们的本科教育提出了巨大挑战。 - 其实学什么都需要天份,而每个人都有自己的特有天份。两者对上号了,就会以兴趣的形式表现出来,这个人一般必成大器。
但是我们的教育使得每个人一步步失去对自己的认识,要你做一个全才,并以名利作为学习、职业选择的基本前提,所以大多数人不得不在痛苦中不断学习、挣扎一身。
那些逝去的大师,大家都说他们视名利为粪土,其实是他们选择了兴趣而不是某些人的需要,从而把自己的天份发挥到极致。试想,如果让陈景润放弃数学选择中文,让齐白石选择物理放弃艺术,估计两人都不会成功。 - 以0.95的概率,谢老大比老同志年轻一点,比年轻人老一点。
- 最好用原版的。