王笑权
王笑权 安徽省五河县临北乡石家村卫生室 233316 Emil:wangxiaoquan001@126.com
由于我国政府对老百姓健康情况的重视,每年投入大量资金、人力、物力进行免疫接种,预防传染病,产生了效果,迄今为止一部分传染病已几乎终止发生。随着法定报告传染病疫情监测、报告系统的改善,新的传染病病种的加入及其他部分导致传染病发生因素的变化,我国传染病疫情状况尚不容乐观,发病数、病死数都表现有长期上升的趋势。本文试用因子分析探讨部分法定报告传染病的逐月发生情况。
1 资料来源
资料主要来源与中华人民共和国卫生部网站,为05-06年的逐月“全国法定报告传染病发病、死亡统计表”中的死亡统计数据。在实际应用中取某种传染病两年对应月份的平均数录入SPSS13.0,抛弃那些有单元格为0的变量后见数据1。
月份 艾滋病 病毒肝炎 出血热 狂犬病 痢疾 肺结核 脑膜炎 破伤风
1 37.0 83.0 12.0 97.0 11.5 144.0 19.0 16.5
2 32.0 78.5 11.5 110.5 5.0 156.5 38.0 14.0
3 66.5 120.0 20.0 143.5 6.5 207.5 38.5 17.5
4 61.5 108.5 17.5 144.0 6.5 210.0 19.0 10.0
5 74.5 100.5 11.0 170.5 8.5 202.5 9.0 18.5
6 110.5 96.0 14.5 188.0 13.0 199.5 3.5 15.0
7 106.5 86.5 8.0 223.0 18.0 214.0 2.0 22.5
8 105.5 96.5 7.5 279.5 23.0 244.5 2.5 21.5
9 101.0 79.0 9.0 268.0 10.0 245.0 1.5 15.0
10 79.0 77.0 14.0 274.0 6.0 204.5 2.0 13.5
11 85.0 113.5 32.0 248.5 7.5 237.0 4.0 23.0
12 96.0 104.5 29.0 295.0 6.0 281.5 16.0 22.0
2 方 法
初步的描述性统计量表明,变量间偏相关系数通过检验;球形检验说明相关系数矩阵非单位阵;本数据可以用于因子分析。
表1 KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .591
Bartlett's Test of Sphericity Approx. Chi-Square 57.355
df 28
Sig. .001
然后用主成分解进行分析,提取公因子,观察总方差解释以决定保留公因子的个数。
表2 Total Variance Explained
Component Initial Eigenvalues
Total % of Variance Cumulative %
1 3.717 46.460 46.460
2 2.228 27.854 74.314
3 .965 12.059 86.372
4 .516 6.455 92.828
5 .340 4.247 97.074
6 .112 1.402 98.476
7 .087 1.088 99.564
8 .035 .436 100.000
因为前三个特征值的累计贡献率达到了86.372%,此时,8个变量反映的信息由三个主成分表达;
公式 1 。
Z1=艾滋病*0.923+狂犬病*0.901+肺结核*0.847+脑膜炎*(-0.763)+破伤风*0.659+出血热*0.157+肝炎*0.156+痢疾*0.518 ;
Z2=艾滋病*(-0.126)+狂犬病*0.027+肺结核*0.372+脑膜炎*0.408+破伤风*0.203+出血热*0.923+肝炎*0.801+痢疾*(-0.609) ;
Z3=艾滋病*(-0.044)+狂犬病*(-0.347)+肺结核*(-0.185)+脑膜炎*0.228+破伤风*0.539+出血热*(-0.112)+肝炎*0.386+痢疾*0.552 。
于是指定程序输出三个公因子,用四分位最大正交旋转法,使解释变量的因子数小,简化对观察变量的解释,旋转后因子载荷矩阵见表3
Component
1 2 3
狂犬病 .962 .068 -.055
艾滋病 .892 .014 .273
肺结核 .838 .432 -.037
脑膜炎 -.818 .330 -.151
病毒肝炎 -.027 .893 .135
出血热 .132 .865 -.352
痢疾 .342 -.336 .845
破伤风 .432 .450 .614
这时候可建立原变量逐月病死情况综合评价得分公式,以便观察该指标病死情况在12个月中的变化,并综合性的进行风险排序。
公式 2。
狂犬病=0.962*F1+0.068*F2+(-0.055) *F3 ;
艾滋病=0.892*F1+0.014*F2+0.273 *F3 ;
。
输出的因子成分得分系数矩阵见表4
Component
1 2 3
艾滋病 .252 -.027 .051
病毒肝炎 -.113 .461 .257
出血热 .054 .365 -.225
狂犬病 .346 -.053 -.256
痢疾 -.041 -.073 .643
肺结核 .268 .139 -.159
脑膜炎 -.282 .208 .093
破伤风 -.022 .274 .526
此时在SPSS中编辑程序,可将表4中的成分得分系数与各标准化变量求积和得出个案的公因子得分,
此结果就是程序用最小二乘回归对个案公因子归属判断的输出结果。
数据2 程序最小二乘判断 编程判断
月份 fac1 fac2 fac3 综合评价得分 排序 f1 f2 f3 得分 排序2
1 -1.48 -.66 .56 -.80 11 -1.48 -.66 .56 -.80 11
2 -1.67 -.57 -.56 -1.00 12 -1.67 -.57 -.56 -1.00 12
3 -1.12 1.48 .28 -.07 7 -1.12 1.47 .28 -.08 7
4 -.63 .22 -.95 -.35 10 -.63 .22 -.95 -.35 10
5 -.26 -.02 .29 -.09 8 -.26 -.02 .29 -.09 8
6 .30 -.43 .18 .04 6 .30 -.43 .18 .04 6
7 .52 -.59 1.52 .26 4 .52 -.60 1.52 .26 4
8 .89 -.36 1.83 .53 3 .89 -.36 1.83 .53 3
9 1.09 -1.10 -.83 .10 5 1.09 -1.10 -.83 . 10 5
10 .70 -1.10 -1.56 -.17 9 .70 -1.10 -1.56 - .17 9
11 .60 1.65 -.07 .73 2 .60 1.65 -.07 .73 2
12 1.06 1.48 -.70 .82 1 1.06 1.49 -.70 .82 1
4 讨 论
传染病的病死情况比较复杂,影响因素可能会很多。本文在此用因子分析法对部分传染病建立了单个、全体指标在12个月份因素的评价体系,仔细解读因子分析过程,可以发现很多有用信息。根据公式2 可对单个指标在12个月份病死进行综合风险评价、排序;用最小二乘回归、编程则可对全部指标进行个案公因子支配归属进行判别,及相关综合评价、排序。可见,病死率在12个月份并不相同,考虑这种现象与支配8个指标的三个公因子的属性不同有关,由表4可粗略看出,第三公因子主要支配杆菌的病死信息;第二公因子则以病毒致死信息为主;值得注意的是第一公因子支配的疾病基本上是目前我国主要在上升的传染病。在全部指标的综合分析中可见,我国法定报告传染病病死人数排序第一、二的月份是12月、11月,此2月受第二因子支配,提醒病毒性疾病所导致的病死应当引起人们的注意。
附,本次分析的SPSS程序;
FACTOR
/VARIABLES x1 x2 x3 x4 x5 x6 x7 x8 /MISSING LISTWISE /ANALYSIS x1 x2 x3 x4 x5 x6 x7 x8
/PRINT UNIVARIATE INITIAL CORRELATION SIG DET KMO INV REPR AIC EXTRACTION ROTATION FSCORE
/FORMAT SORT
/PLOT EIGEN ROTATION
/CRITERIA FACTORS(3) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION QUARTIMAX
/SAVE REG(ALL)
/METHOD=CORRELATION .
COMPUTE F1=0.252*(X1-79.5833)/26.47712-0.113*(X2-95.2917)/14.58745+0.054*(X3-15.5)/7.93725+0.346*(X4-203.4583)/70.158745
-0.041*(X5-10.125)/5.51084+0.268*(X6-212.2083)/37.70125-0.282*(X7-12.9167)/13.57778-0.022*(X8-17.4167)/4.1606 .
COMPUTE F2= -0.027*(X1-79.5833)/26.47712+0.461*(X2-95.2917)/14.58745+0.365*(X3-15.5)/7.93725-0.053*(X4-203.4583)/70.158745
-0.073*(X5-10.125)/5.51084+0.139*(X6-212.2083)/37.70125+0.208*(X7-12.9167)/13.57778+0.274*(X8-17.4167)/4.1606 .
COMPUTE F3=0.051*(X1-79.5833)/26.47712+0.257*(X2-95.2917)/14.58745-0.225*(X3-15.5)/7.93725-0.256*(X4-203.4583)/70.158745
+0.643*(X5-10.125)/5.51084-0.159*(X6-212.2083)/37.70125+0.093*(X7-12.9167)/13.57778+0.526*(X8-17.4167)/4.1606 .
COMPUTE Z=0.4646*F1+0.27854*F2+0.12059*F3 .
COMPUTE Z1=0.4646*FAC1_1+0.27854*FAC2_1+0.12059*FAC3_1 .
EXECUTE .
RANK
VARIABLES=Z Z1 (D) /RANK .
说明;因为本次收集到的资料周期太短,加之本人认识的局限。文中认识定有不到之处,故请观看的朋友不要把此帖当论文看待。