五阿哥
方便的话,我可以把这两篇文章发到你的邮箱里
hexm26
第一篇不用了,我已经下载到了。如果可以的话,请把第二篇传给我。
第一篇应该更和你的研究课题相关,因为都是后验性的研究(retrospectively);你用的风险因素和大小动脉瘤组的各自分析方法是一样的,但他们后来将所有的风险因素放到一个Multiple Logistic Regression中。这点和我从前看你的帖子想象的不一样,我还以为你会各自做独立的Logistic Regression。我觉得你可以按第一篇的文章方法来做,这个Multiple Logistic Regression应该是对前面的独立分析的一个补充。注意的是,你原来是把位置这组分成了6组,其实应该只分成2组,5和6在一组,其他在另一组,然后再做Multiple Logistic Regression。所有的解释变量全写成Binary,即0,1的形式,就像第一篇文章那样做。
五阿哥
把位置分为两组在医学上是说不通的,这是6个不同的位置,我要看这6个位置中,哪个对破裂小动脉瘤影响大,我叫的那个人,就是把所有因素都考虑进去,然后做 Logistic Regression,最后就得出下面的结论
变量 参数值 标准误 OR(95%CI)
p值
前交通动脉 1.5900 0.5727 4.904(1.596-15.067) 7.7077 0.0055
大脑前动脉 1.5210 0.4708 4.577(1.819-11.517) 10.4375 0.0012
连单因素分析出的有统计学意义的血压都被排除在外
所以我文章的最后的结论就是位于前交通动脉和大脑前动脉的动脉瘤建议尽早治疗。第二篇文章我不知道怎么发给你
五阿哥
我白天上班,只有晚上回来后才能看到你的留言
hexm26
[quote]引用第22楼五阿哥于2008-12-22 20:19发表的“”:
把位置分为两组在医学上是说不通的,这是6个不同的位置,我要看这6个位置中,哪个对破裂小动脉瘤影响大,我叫的那个人,就是把所有因素都考虑进去,然后做 Logistic Regression,最后就得出下面的结论
变量 参数值 标准误 OR(95%CI)
p值
前交通动脉 1.5900 0.5727 4.904(1.596-15.067) 7.7077 0.0055
大脑前动脉 1.5210 0.4708 4.577(1.819-11.517) 10.4375 0.0012
.......[/quote]
你误会我的意思了,我不是说只是将位置分为两组,而是说在分析上,将小的破裂动脉瘤最容易的2个地方分为一组,然后所有其他的地方为一组,这样才能做OR的比较。
hexm26
[quote]引用第23楼五阿哥于2008-12-22 20:20发表的“”:
我白天上班,只有晚上回来后才能看到你的留言[/quote]
我也一样,因为年末公司放假,我才有时间来逛论坛,平时根本忙不过来。
我就Ohashi(2003)的文章说说可能用到的统计方法。Ohashi一文用到了3种方法:(1)单因素方差分析(Oneway ANOVA),因变量是动脉瘤的大小,为连续变量,而解释变量为性别,年龄组(40岁为临界点),是否饮酒,以及高血压病史等风险因素;(2)卡方分布检验(Chi Squared Test),解释变量与(1)相同,但因变量是动脉瘤的大小组别,即小于5MM和大于或等于5MM,为分类变量;(3)多因素Logistic模型,因变量和(2)相同,为动脉瘤的大小组别,而解释变量全部为2分变量,象性别这样的不做变动,而动脉瘤在颅内的位置则转换成:组一为AcomA与ACA,组二为ICA,MCA和其他。所有的解释变量都是主成分,没有交叉项,与动脉瘤的大小组别进行Logistic回归,并计算OR。
这3种方法其实相互补充,解释的都是同一个问题:那个风险变量是最能与破裂的动脉瘤的大小相联系的。看得出来,目前你所做的结论应该和Ohashi一文的结论是一致的:血压和位置有对破裂的动脉瘤的大小有统计学差异。
所以说你可以基本上模仿Ohashi一文的做法,同时用3种方法来验证你的结论。现在我们回到你最开始提出的问题:“....其中位置组我把他们分为5个部位,后来我用logist回归求出位于上升5个位置中的两个位置是颅内小动脉瘤的影响因素,请问我这样的条件分析可行吗?”应该说,你将上升5个位置中的两个位置做为一组(像Ohashi一文那样,因为这一组是你最怀疑有可能影响破裂的动脉瘤的大小的两个位置),进行Logistic回归(单因素或多因素)都是可以的;但像10楼你贴出来的那种分两个位置再单做Logistic回归是没有必要的,而且我非常怀疑这样会出错,因为无论你怎么分组,这两个位置都会站在各自分析的对立面,自相矛盾从而混淆你的结论。
五阿哥
非常感谢,终于有人明白我的意思了,就是说嘛,曾经有人叫我这篇文章投国内顶级核心期刊,还有一个问题就是现在单因素分析有血压和位置两个因素在<7MM和>7MM的瘤之间有统计学差异,Logistic回归分析只有位置一个有统计学差异,那么我的结论是否应该以Logistic回归为主,还有最理想的结论(为了不让人误解我是研究动脉瘤破裂的原因)您看如何下好,谢谢,我原本是这样下的:相对于>7MM的颅内破裂动脉瘤而言,位置A和位置B可能更容易导致颅内<7MM的小动脉瘤破裂。再次感谢!
hexm26
[quote]引用第26楼五阿哥于2008-12-29 12:44发表的“”:
非常感谢,终于有人明白我的意思了,就是说嘛,曾经有人叫我这篇文章投国内顶级核心期刊,还有一个问题就是现在单因素分析有血压和位置两个因素在<7MM和>7MM的瘤之间有统计学差异,Logistic回归分析只有位置一个有统计学差异,那么我的结论是否应该以Logistic回归为主,还有最理想的结论(为了不让人误解我是研究动脉瘤破裂的原因)您看如何下好,谢谢,我原本是这样下的:相对于>7MM的颅内破裂动脉瘤而言,位置A和位置B可能更容易导致颅内<7MM的小动脉瘤破裂。再次感谢![/quote]
对你的这个说法我表示谨慎的反对。因为统计分析的结果只是表明位置和破裂的动脉瘤大小有某种关联,而很难做出因果的判断,至少Ohashi一文就是如果。我觉得这样写是否更合适:就目前所收集的样本资料表明,相对于>7MM的颅内破裂动脉瘤而言,颅内<7MM的小动脉瘤更容易在位置A和位置B破裂。当然,你对专业更熟悉一些,是否真正存在因果关系由你来决定。
我对你的单因素分析和Logistic回归有矛盾的结论表示不解。理论上说,两者应该都得出血压的统计学差异结论,或没有统计学差异结论(前者更有可能)。你可以告诉我P值分别是多少吗?从统计学上还是专业上看,所有的分析应该是相互印证,相互支持的。没有解决不了的问题,只有不会解决的人才会有问题。
我个人觉得,你的文章很有研究价值,从结论上看,应该和Ohashi的文章基本相同,但样本群不一样。欧美人和南美西班牙裔的动脉瘤破裂临界点要高一些,一般是10MM到15MM(甚至更高),Ohashi定义日本人为5MM,而中国人以及南亚人和日本人并非同一个族裔,所以你的定义7MM应该有很好的医学意义。如果统计分析部分把握好了,发到国内或国外的顶级核心期刊都没有问题。
五阿哥
血压的卡方检验(χ2=5.14, p =0.023),lofistic回归的P值24楼表里有的,谢谢您!祝你新年快乐!
五阿哥
(χ2=20.99, p =0.0008)这是位置单因素卡方检验的结果
hexm26
[quote]引用第28楼五阿哥于2009-01-01 22:37发表的“”:
血压的卡方检验(χ2=5.14, p =0.023),lofistic回归的P值24楼表里有的,谢谢您!祝你新年快乐![/quote]
24楼是我给你的回贴。你就再说一遍血压在Multiple Logistic Regression里的P值吧。如果有OR或回归的估计值,也给写出来。
aves
搬个板凳,插个队,学习一下,虽然有些东西不太懂呵呵
五阿哥
logisyic回归是我请搞统计的学生帮我做的,等我明天回去和他联系后再告诉你,记得他说过血压没有进入模型什么的
五阿哥
他说血压没有进入模型,没有P值
hexm26
[quote]引用第33楼五阿哥于2009-01-05 14:39发表的“”:
他说血压没有进入模型,没有P值[/quote]
那你让那个统计学生重新做,将血压放入Multiple Logistic Regression里面,就像Ohashi的文章那样。理论上说,单因素分析和Multiple Logistic Regression的结果应该是互相支持的。
五阿哥
他说是用的非条件logistic回归做的,麻烦了他N次,我不好意思让他在再做了,我想自己做做看望您指导一二,还有我也问过几位统计学博导,他们说血压可能受了其它因素的影响,比如血压和冠心病的关系比较密切,后者可能会导致logistic回归里不出现血压这种情况,您看怎么办?
hexm26
你的第一个帖子提到“年龄、血压、性别、血糖、动脉瘤的部位等7个指标”,是不是你将冠心病的病史也做为其中一个指标?
五阿哥
没有,我没有冠心病的指标,只是说了个例子,那我刚才自己做了个logistic回归,是把血压和位置这两个单因素有统计学意义的变量做logistic回归,不是Multiple Logistic Regression是做的Binary Regression,几点说明(血压中1代表高血压,0代表没有高血压;位置中有1、2、3、4、5、6、个位置)结果如下: Case Processing Summary
Unweighted Casesa N Percent
Selected Cases Included in Analysis 272 100.0
Missing Cases 0 .0
Total 272 100.0
Unselected Cases 0 .0
Total 272 100.0
a. If weight is in effect, see classification table for the total number of cases.
Dependent Variable Encoding
Original Value Internal Value
1 0
2 1
Iteration History(a)(,)(b)(,)(c)
Coefficients
Iteration -2 Log likelihood Constant
Step 0 1 377.013 .029
2 377.013 .029
a. Constant is included in the model.
b. Initial -2 Log Likelihood: 377.013
c. Estimation terminated at iteration number 2 because parameter estimates changed by less than .001.
Classification Table(a)(,)(b)
Predicted
DAXIAO2
Observed 1 2 Percentage Correct
Step 0 DAXIAO2 1 0 134 .0
2 0 138 100.0
Overall Percentage 50.7
a. Constant is included in the model.
b. The cut value is .500
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 0 Constant .029 .121 .059 1 .808 1.030
Variables not in the Equation
Score df Sig.
Step 0 Variables XUEYA 9.807 1 .002
WEIZHI 6.128 1 .013
Overall Statistics 15.678 2 .000
Iteration History(a)(,)(b)(,)(c)(,)(d)
Coefficients
Iteration -2 Log likelihood Constant XUEYA WEIZHI
Step 1 1 360.977 .052 -.814 .177
2 360.939 .057 -.854 .187
3 360.939 .057 -.854 .187
a. Method: Enter
b. Constant is included in the model.
c. Initial -2 Log Likelihood: 377.013
d. Estimation terminated at iteration number 3 because parameter estimates changed by less than .001.
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 16.075 2 .000
Block 16.075 2 .000
Model 16.075 2 .000
Model Summary
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 360.939a .057 .077
a. Estimation terminated at iteration number 3 because parameter estimates changed by less than .001.
Hosmer and Lemeshow Test
Step Chi-square df Sig.
1 6.142 6 .407
Contingency Table for Hosmer and Lemeshow Test
DAXIAO2 = 1.00 DAXIAO2 = 2.00
Observed Expected Observed Expected Total
Step 1 1 39 38.238 20 20.762 59
2 22 22.255 17 16.745 39
3 34 29.730 24 28.270 58
4 5 9.319 15 10.681 20
5 10 12.304 18 15.696 28
6 10 9.795 15 15.205 25
7 9 8.039 17 17.961 26
8 5 4.321 12 12.679 17
Classification Table(a)
Predicted
DAXIAO2
Observed 1 2 Percentage Correct
Step 1 DAXIAO2 1 95 39 70.9
2 61 77 55.8
Overall Percentage 63.2
a. The cut value is .500
Variables in the Equation
95.0% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step 1a XUEYA -.854 .276 9.562 1 .002 .426 .248 .731
WEIZHI .187 .076 6.018 1 .014 1.205 1.038 1.399
Constant .057 .323 .031 1 .861 1.058
a. Variable(s) entered on step 1: XUEYA, WEIZHI.
Correlation Matrix
Constant XUEYA WEIZHI
Step 1 Constant 1.000 -.577 -.693
XUEYA -.577 1.000 -.044
WEIZHI -.693 -.044 1.000
Step number: 1
Observed Groups and Predicted Probabilities
80 ┼ ┼
│ │
│ │
F │ │
R 60 ┼ 2 2 ┼
E │ 2 2 │
Q │ 2 2 │
U │ 2 2 │
E 40 ┼ 1 2 ┼
N │ 1 1 │
C │ 1 2 1 2 │
Y │ 1 2 1 2 2 │
20 ┼ 1 2 1 2 2 2 ┼
│ 1 1 1 2 2 2 2 │
│ 1 2 1 1 2 1 2 2 1 2 2 │
│ 1 1 1 1 1 1 1 2 1 1 1 2 │
Predicted ─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼──────────
Prob: 0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1
Group: 1111111111111111111111111111111111111111111111111122222222222222222222222222222222222222222222222222
Predicted Probability is of Membership for 2.00
The Cut Value is .50
Symbols: 1 - 1.00
2 - 2.00
Each Symbol Represents 5 Cases.
怎么这个logistic回归里血压好像有意义啊?
shenshen0455
五阿哥很执着的,在好几个论坛都问这几个问题。
hexm26
[quote]引用第37楼五阿哥于2009-01-06 13:20发表的“”:
没有,我没有冠心病的指标,只是说了个例子,那我刚才自己做了个logistic回归,是把血压和位置这两个单因素有统计学意义的变量做logistic回归,不是Multiple Logistic Regression是做的Binary Regression,几点说明(血压中1代表高血压,0代表没有高血压;位置中有1、2、3、4、5、6、个位置)结果如下: Case Processing Summary
Unweighted Casesa N Percent
Selected Cases Included in Analysis 272 100.0
Missing Cases 0 .0
Total 272 100.0
.......[/quote]
论坛的排版系统不好,我几乎看不明白。你用单因素Logistic回归,和单因素的卡方分布是一回事,当然会得出一样的结论。其实即使你把所有的风险因素(7个指标)全放在一个Multiple Logistic Regression,其实也就是个补充论证的作用,放不放你自己决定,但加上要好一些,仅此而已。