wiz
遇到个问题,老师让用data step编写一个可以用于计算Chi-Square的程序,只能用data step,不能用proc啥的,有没有那个高人能给个sample?急,在线等,谢谢。
fairy
首先,你要明白什么是Chi-Square检验,以及相应的统计量,然后就根据一般的程序语言运用各种运算符把计算该统计量的表达式写出来,然后用卡方分布求概率的函数求出形影的概率值就可以了。
既然是老师布置的作业,我想你还是老老实实的通过查找相关内容学习吧,否则你根本就不能掌握SAS。
以后还有很多检验是没有直接的过程可以实现的,需要你编程来实现。熟悉一下SAS的赋值雨具和统计函数也是很有必要的。
fairy
当然,如果给的是原始数据而不是汇总数据,你可以先作频数分析得到汇总的数据,输出到SAS数据集后再编写卡方检验的程序
wiz
谢谢楼上,我自己弄明白了一些,只是看英文觉得理解不透彻,所以找到这里想看看大家怎么解决这类问题。
另外有些问题不知道专业上怎么命名,所以google不到我想要的信息。比如下面的信息:
Any rule _LHAND _RHAND can be arranged as the following contingent table .
Table 1 Observed Frequency Table
_RHAND
Yes No Column Total
_LHAND Yes X11 X12 X1.
No X21 X22 X2.
Row Total X.1 X.2 N
The following quantity in the data set can be defined as follows:
(1) Support (_LHAND-->_RHAND)= X11/N
(2) Conf(_LHAND-->_RHAND)= X11/X1.
(3) Lift(_LHAND_RHAND)= (X11/X1.)/(X.1/N)
(4) Count=X11
我遇到了几次这样的问题,感觉上面的表格好像是个统计里常用的东西,但一直不知准确含义。老师给这个东西只为了方便表达?还是内涵了什么统计学的东西?我统计底子浅,只能问得这么不专业了。
fairy
看看二维数据的排列啊:)
至于支持度啊,信心啊,功效啊什么的,你就不用管名字了,直接看定义就很清楚啊:
X11代表_LHAND和_RHAND取值都是"yes"的观测数
N代表总的观测数
X1.代表_LHAND取值为"yes"的观测数
X.1代表_RHAND取值为"yes"的观测数
P.S.你应该弄明白你要做的是一个什么样的分析
王笑权
比较稳妥的是编一个精确检验程序+一致性检验