• 统计学
  • [求助]统计中的困惑!用参数还是非参数方法统计?

我做了两轮教学实验,分为实验组合对照组。实验结果有许多指标,本来用t检验。可是这些指标经检验:有的是正态分布,有的不是。我该怎么统计分析?正态的用t检验,非正态的用非参数检验?样本量大于等于30。到底怎样统计?



请各位伸出援助的双手!谢谢!
rtist 您好!

您说得好像很在理?但是我是菜鸟!不懂!看的一头雾水!什么是误差项。看来我需要系统的学习!

就我这个问题怎么解决?用什么方法来统计?这个急用!谢谢!!!
我今天看了一天的统计书,似乎有点明白!但是海糊涂!

一般来说、样本大于30,即可以认为近似的是符合正态!

我又同意rtist的观点,不能随意转化成正态(今天刚学的)、模型应该符合数据。经检验误差项不成正态分布。用非参数检验如何?大家给评述一下!
[quote]引用第3楼longlong20082007-01-15 16:28发表的“”:

我今天看了一天的统计书,似乎有点明白!但是海糊涂!

一般来说、样本大于30,即可以认为近似的是符合正态!

我又同意rtist的观点,不能随意转化成正态(今天刚学的)、模型应该符合数据。经检验误差项不成正态分布。用非参数检验如何?大家给评述一下! [/quote]

样本量大于三十并不保证可以近似认为正态,原来常说的30至少还是有条件的,现在的书里怎么就给改成了“一般来说"?什么叫一般?



非参检验的条件如果能够满足,样本量又足够的大,那当然可以用。但是非参比较难处理潜在数据的不独立性;绝大多数非参方法都需要iid假定。教学实验最为突出,因为如果按班级授课的话,班级是实验单元,学生不是实验单元,学生只是一个班级内的一个观测单元;且同一班级内的学生之间显然不独立。



既然楼主说样本量大,又说是教学实验,那么正确的理解就是你用上百个班级做了试验,而不是两个班级的上百个学生(除非单人教学、没有班级的概念)。前些日子好象哪个板块(好像是数理统计吧?)里面有一个类似的问题。





题外话:

有一个说法我现在比较赞同:基础统计书里面的阐述、以及基础统计课程的讲授,其目的并不是让人读过之后可以独立分析数据——这个目的国内外都肯定达不到;目的仅仅是让学生有统计这么个概念、什么时候需要咨询统计学家、如何咨询统计问题、如何阐述问题、以及如何理解咨询得到的答案——可是这个目的也很难实现,至少绝大多数仅学过基础统计课程的人都还达不到。讲统计课,最不重要的东西就是讲 t 检验怎么做——如果讲t检验的过程,小学生都能学会;但是t检验仍然可以作为一个很好的课堂“例子”来介绍给学生。

只要对样本所来自的总体做了假设,不管是什么样的分布,只要是单峰的就可以认为它近似正态,可以进行t检验,但是如果总体分布形态根本不做假定,也没有历史资料表明它可能是什么分布,我认为应该用非参数检验

[quote]引用第4楼rtist2007-01-16 05:16发表的“”:



样本量大于三十并不保证可以近似认为正态,原来常说的30至少还是有条件的,现在的书里怎么就给改成了“一般来说"?什么叫一般?



非参检验的条件如果能够满足,样本量又足够的大,那当然可以用。但是非参比较难处理潜在数据的不独立性;绝大多数非参方法都需要iid假定。教学实验最为突出,因为如果按班级授课的话,班级是实验单元,学生不是实验单元,学生只是一个班级内的一个观测单元;且同一班级内的学生之间显然不独立。



.......[/quote]

您指出的很尖锐。您是内行人,一般的说是我自己说得。没有根据。如果能收回的我收回!



我做的是一种教学方法的研究,比较教学方法的优劣。 这不知道算不算教学实验!

我认为个体就是研究的对象,他是否是独立的?

您的意思我明白:我的统计基础很差!但是我觉得统计书籍的存在,就是让大家学习的,特别是像我这样的人的学习,通过他我进步可能会慢,但是也是进步!毕竟我们不是专业的统计人员,理解到的不到位,甚至不理解,提出的问题可能比较幼稚!但是我在学习!我在进步!

术业有专攻,如果在我的专业领域,您恐怕 ……!

我如果什么都明白的话,我还需要问问题么?
[quote]引用第5楼daz09122007-01-16 20:34发表的“”:

只要对样本所来自的总体做了假设,不管是什么样的分布,只要是单峰的就可以认为它近似正态,可以进行t检验,但是如果总体分布形态根本不做假定,也没有历史资料表明它可能是什么分布,我认为应该用非参数检验[/quote]

极端点儿说,用cauchy(0,1)就单峰、对称而没法用t检验。不过没啥意思。

我想说的是,1)单峰和正太差得远;2)单峰也不能保证CLT收敛速度就肯定快;3)那些rules of thumb说出来可以,但是针对任何一个具体应用的时候,必须需要谨慎对待。





非参不假定分布形式,难道也不假定iid?楼主的数据最可能的问题是不独立,而不是分布形式。
[quote]引用第6楼longlong20082007-01-16 23:37发表的“”:

我认为个体就是研究的对象,他是否是独立的?

.......[/quote]独不独立这要问你,你的处理因素是什么,你的实验单元是什么,你的观测单元是什么,你能保证学生之间没有影响教学效果的关系么?



我也不是统计出身的,关于统计学习与教学,我的观点已经在数理统计版那个学习顺序的回帖里面解释过了——统计就是面向应用的,根本就不应该开设本科的统计专业,但是所有专业的本科生都应该开设基础统计课,本科学生都应该学至少一门纯粹的science。



只要做科研,就没有理由不学好统计,或者与做统计的人合作。合作的前提就是,大家需要将同一种语言,本科的统计课的目的就是让学生学会这门语言,否则统计学家提供什么样的咨询也没法理解。
统计在国内分为社会统计和数理统计,好像二者还存在隔阂,很多概念还存在不统一。楼上所说,现在大学基本每个专业都有一门共同课就是《概率论与数理统计》,只是可惜学的太浅。



再补充一句,非参方法又称为distribution-free 方法,对总体信息了解甚少一般用这个。 此外,国内有些统计书实在太烂,有时候写不清楚或者过于理论,非统计方向的很难明白,容易混淆。
[quote]引用第9楼wumaths2007-01-17 11:35发表的“”:楼上所说,现在大学基本每个专业都有一门共同课就是《概率论与数理统计》,只是可惜学的太浅。

[/quote]据我所知,有的专业还没有开这门课。如果只能开一门课,这门课应该兼顾理论和方法,单纯理论课或者单纯方法课都不合适。我觉得学的浅一点没有太大问题,但是不能学错学乱。至于描述性统计这样的内容,应该放到高中去。
[quote]引用第8楼rtist2007-01-17 07:58发表的“”:









只要做科研,就没有理由不学好统计,或者与做统计的人合作。合作的前提就是,大家需要将同一种语言,本科的统计课的目的就是让学生学会这门语言,否则统计学家提供什么样的咨询也没法理解。[/quote]

这种观点我同意,但现在的统计实际教学情况就是,学生很少能认真去学,等用到时,又没有地方去补。

这就是现状,不能怪别人,自己缺什么就应该补什么!我想我们坛子的宗旨决不光是几个高手论道,而且应该传播,普及统计知识,让更多的人能够使用它。我觉得坛子(从专业角度,眼光去分析)应该推荐一本,或者是几本有助于了解统计知识的书籍,已备出初级的人学习。并专门开设相关的板块,进行交流。这样统计专业的学生也知道,非统计人员的缺陷到底在那里? 积累经验有利于其将来的发展。

不知同意否?
[quote]引用第11楼longlong20082007-01-17 20:53发表的“”:



这种观点我同意,但现在的统计实际教学情况就是,学生很少能认真去学,等用到时,又没有地方去补。

这就是现状,不能怪别人,自己缺什么就应该补什么!我想我们坛子的宗旨决不光是几个高手论道,而且应该传播,普及统计知识,让更多的人能够使用它。我觉得坛子(从专业角度,眼光去分析)应该推荐一本,或者是几本有助于了解统计知识的书籍,已备出初级的人学习。并专门开设相关的板块,进行交流。这样统计专业的学生也知道,非统计人员的缺陷到底在那里? 积累经验有利于其将来的发展。

不知同意否?[/quote]

同意。我在英文版里推荐了开个statistical education版,可是其实没什么用,绝大多数帖子/求助都是中文的。



应该说,对于提供咨询的人来说,学习“问诊"是重要一步;对接受咨询的人来说,知道如何描述“症状”也是必不可少的。
我也是学习教育统计的,学习统计也没多长时间,看大家讨论那么多不由的想来支持一下,对于我们这种不是数学系出身的,统计学起来有点难,需要注意的问题比较多。

在我看来,学习统计有时就是学习从不同的视角去看待问题。给我们一种解决问题的办法,多一种思考的角度。其实好多学科都一样。

不过想问一下,多元统计那里应该怎样有效的去学习,不看原理吧,问题出来不知道如何去解释,看吧有太难。
[quote]引用第10楼rtist2007-01-17 15:07发表的“”:

据我所知,有的专业还没有开这门课。如果只能开一门课,这门课应该兼顾理论和方法,单纯理论课或者单纯方法课都不合适。我觉得学的浅一点没有太大问题,但是不能学错学乱。至于描述性统计这样的内容,应该放到高中去。[/quote]



你别说,现在的高中确实引入了一些描述性统计的内容了,计算均值、方差。画个直方图什么的。现在国内写书成风,好书太少了,一旦选择烂书,可想而知有什么后果。
[quote]引用第13楼longxiaolin2007-01-17 23:00发表的“”:

我也是学习教育统计的,学习统计也没多长时间,看大家讨论那么多不由的想来支持一下,对于我们这种不是数学系出身的,统计学起来有点难,需要注意的问题比较多。

在我看来,学习统计有时就是学习从不同的视角去看待问题。给我们一种解决问题的办法,多一种思考的角度。其实好多学科都一样。

不过想问一下,多元统计那里应该怎样有效的去学习,不看原理吧,问题出来不知道如何去解释,看吧有太难。[/quote]



国内统计分为两类,文科统计就是社会统计学,还有就是理科统计就是数理统计学。两者的思维方式很不一样,数理统计方向的老师一般都是数学出身,爱证明,搞推导。社会统计偏重于应用,但是国内的很多搞社会统计的不懂得统计方法的使用意义,存在乱套用现象。同样理论统计的对于实际应用的问题解释很多搞不清楚,总之二者现在脱节。

对于文科生的建议就是一定要搞清楚自己所使用的统计分析方法的来源和意义。当你有几种方法可以选择时候,要问自己哪一种更好?分别都有什么优缺点? 要搞清楚方法的适用性,满足哪些条件才可以使用等?



对于多元分析,初学者可以看一下王学民老师的《应用多元统计分析》,比较适合文科生。另外一本是北大高惠璇老师也有一本,都使用 sas进行分析的,你可以有选择的比较选择一本。理论一点的国内有好几本了,张尧廷是这方面的专家,可以看他的。
5 天 后
[quote]引用第15楼wumaths2007-01-18 01:13发表的“”:





国内统计分为两类,文科统计就是社会统计学,还有就是理科统计就是数理统计学。两者的思维方式很不一样,数理统计方向的老师一般都是数学出身,爱证明,搞推导。社会统计偏重于应用,但是国内的很多搞社会统计的不懂得统计方法的使用意义,存在乱套用现象。同样理论统计的对于实际应用的问题解释很多搞不清楚,总之二者现在脱节。

对于文科生的建议就是一定要搞清楚自己所使用的统计分析方法的来源和意义。当你有几种方法可以选择时候,要问自己哪一种更好?分别都有什么优缺点? 要搞清楚方法的适用性,满足哪些条件才可以使用等?



.......[/quote]

谢谢!!!!!我想这种争论,还是有意义的!这个论坛,我觉得很有价值!
1 年 后
[quote]引用第4楼rtist2007-01-16 05:16发表的“”:

基础统计书里面的阐述、以及基础统计课程的讲授,其目的并不是让人读过之后可以独立分析数据——这个目的国内外都肯定达不到;目的仅仅是让学生有统计这么个概念、什么时候需要咨询统计学家、如何咨询统计问题、如何阐述问题、以及如何理解咨询得到的答案——可是这个目的也很难实现,至少绝大多数仅学过基础统计课程的人都还达不到。讲统计课,最不重要的东西就是讲 t 检验怎么做——如果讲t检验的过程,小学生都能学会;但是t检验仍然可以作为一个很好的课堂“例子”来介绍给学生。



quote]

赞同
样本大于30应该是认为标准误为正态分布,不是指样本为正态分布。

  个人认为有一定统计学基础后,可以参考吴喜之老师的《统计学:从数据到结论》、人大贾俊平老以及厦大等校老师的书籍或者讲义。

  当然极品的参考书是《全美经典》的三套统计学,很多书店有售。