王笑(孝)权 安徽省五河县临北乡石家村卫生室 233316 wxq1638@yahoo.com.cn
目前,拥有创新、高新技术成为世界各国追求的目标。有识之士认为:拥有自主高新技术和发展创新技术既是国家强大的基础,也是经济持续发展的动力,又是企业在激烈的商业竞争立于不败之地的杀手锏。因此,高新技术、创新技术是国家强盛,经济繁荣的标志。若要对我国高新技术现状有所认识,可以对其中的经济指标进行破析。虽然我国的经济发展速度是全世界的最快的,但是国内各个城市、地区发展中的经济状况可能并不平衡。在先前不知道差异的情况下,本文依据国内2006年的高新技术经济指标关系对国内52个城市施行归类探讨。
1 资料与方法
1.1 一般资料 资料来源于网上《2007中国统计年鉴》,取其中的“中国统计年鉴-3”,打开后有u2154c.xls数据文件(为观察方便,本文已将城市排列顺序改变),可见“开发区高新技术企业主要经济指标(2006年)”。在开发区列下各行分别为52个城市的名称,该列向右各列经济指标分别为企业数(个);从业人员(人);总产值(万元);总收入(万元);出口总额(万美元)。
1.2 统计学方法 由于探讨的目的是按高新技术经济指标把城市之间进行分类,故考虑用样品聚类法进行分析。在SAS9.1中用ward(华兹)最小方差法进行聚类分析,观察聚类结果。原始数据已经安排在附件1中的SAS数据步内。
2 结果
当从4进行到3分类时,rsq减小量产生了跳跃式变化,由此提示聚为四类比较合适。聚类的详细过程见输出1—聚类历史:
输出结果1 聚类历史
Cluster History
NCL --Clusters Joined--- FREQ SPRSQ RSQ BSS tie
51 桂林46 保定47 2 0.0000 1.00 37726
50 洛阳37 鞍山38 2 0.0000 1.00 56933
49 太原23 淄博24 2 0.0000 1.00 69472
48 宝鸡40 株洲43 2 0.0000 1.00 71583
47 贵阳49 海南50 2 0.0000 1.00 73138
46 昆明35 南昌36 2 0.0000 1.00 79846
45 成都30 石家庄32 2 0.0000 1.00 90436
44 CL48 福州42 3 0.0000 1.00 93752
43 吉林21 CL49 3 0.0000 1.00 120059
42 CL44 绵阳44 4 0.0000 1.00 162775
41 CL45 郑州31 3 0.0000 1.00 174116
40 CL43 潍坊25 4 0.0000 1.00 176123
39 CL50 襄樊39 3 0.0000 1.00 184590
38 兰州48 CL47 3 0.0000 1.00 195163
37 佛山33 大庆34 2 0.0000 1.00 217216
36 常州27 合肥28 2 0.0000 1.00 222030
35 CL40 济南22 5 0.0000 1.00 230632
34 惠州19 青岛20 2 0.0000 1.00 237919
33 无锡05 深圳06 2 0.0000 1.00 275588
32 沈阳13 大连15 2 0.0000 1.00 281527
31 哈尔滨26 CL36 3 0.0000 1.00 326504
30 杭州09 重庆10 2 0.0000 1.00 328110
29 厦门16 中山18 2 0.0000 1.00 331255
28 乌鲁木齐 杨凌52 2 0.0000 1.00 405714
27 威海29 CL37 3 0.0001 1.00 445010
26 CL29 长沙17 3 0.0001 1.00 477018
25 CL42 南宁41 5 0.0001 1.00 488061
24 CL30 武汉11 3 0.0001 .999 491316
23 CL34 CL35 7 0.0001 .999 499783
22 天津12 CL32 3 0.0001 .999 545527
21 CL51 CL38 5 0.0001 .999 594578
20 CL46 CL39 5 0.0001 .999 596040
19 珠海14 CL26 4 0.0001 .999 663096
18 CL27 CL41 6 0.0001 .999 714893
17 南京03 CL33 3 0.0002 .999 912581
16 CL23 CL31 10 0.0002 .999 996299
15 CL17 苏州04 4 0.0004 .998 1.33E6
14 西安07 长春08 2 0.0006 .998 1.46E6
13 CL24 CL22 6 0.0005 .997 1.63E6
12 CL25 CL21 10 0.0004 .997 1.88E6
11 CL12 包头45 11 0.0011 .996 2.32E6
10 CL18 CL20 11 0.0008 .995 2.85E6
9 CL11 CL28 13 0.0015 .993 3.16E6
8 CL19 CL16 14 0.0014 .992 3.47E6
7 CL14 CL13 8 0.0025 .989 3.62E6
6 CL10 CL9 24 0.0072 .982 1.07E7
5 上海02 CL15 5 0.0284 .954 1.21E7
4 CL7 CL8 22 0.0138 .940 1.44E7
3 北京01 CL5 6 0.3045 .635 3.97E7
2 CL4 CL6 46 0.0697 .566 4.71E7
1 CL3 CL2 52 0.5658 .000 8.65E7
此时通过聚类树形图可直观看见以2006年高新技术经济指标把52个城市归纳、综合分为4个不同水平,见图1:
图1 聚类树图(
http://www.pinggu.org/bbs/dispbbs.asp?boardid=68&id=288856)
鉴于各指标在不同水平观测的值大小交错复杂,且各指标间单位性质不同,不能直接按某整体统一标准比较各分类间有否差异,考虑把SPSS中综合概括全部指标信息的rsr程序(
http://cos.name/bbs/read.php?tid=7703&keyword=)修改成SAS程序,运行一下观察以上聚类后类间区别的能力(见附件2)如何?其sas程序见附件2 ;glm过程输出的lsd检验如下:
输出 l lsd 检验结果
Between 95% Confidence
Comparison Means Limits
1 - 2 0.09615 -0.14971 0.34201
1 - 3 0.34958 0.12032 0.57885 ***
1 - 4 0.72082 0.49155 0.95009 ***
2 - 1 -0.09615 -0.34201 0.14971
2 - 3 0.25343 0.14268 0.36417 ***
2 - 4 0.62467 0.51392 0.73541 ***
3 - 1 -0.34958 -0.57885 -0.12032 ***
3 - 2 -0.25343 -0.36417 -0.14268 ***
3 - 4 0.37124 0.30505 0.43742 ***
4 - 1 -0.72082 -0.95009 -0.49155 ***
4 - 2 -0.62467 -0.73541 -0.51392 ***
4 - 3 -0.37124 -0.43742 -0.30505 ***
可见:除北京(01=类1)与上海等(02-06=类2)差别不显著外,其余类间差别均具有显著性;rsr过程表明各档(类)之间具有方差齐性F=2.32 ,P=0.1089;方差分析输出的F=72.01, P=0.0001,显然分档4个水平(分类)符合统计学区分规律,效果比较理想。根据以上分类,观察各个指标原始数据在此水平下的差异,若不考虑方差齐性(实际是各指标在4分类情况下原始数据均方差不齐,差别很大),在附件2的sas程序glm过程中将rsr逐次改为x1—x5不同指标,便能观察每个指标在各分类水平下的两两对比,唯一没有差异的对比是x5(出口总额)在1、2类水平之间;显然这是由于上海、苏州、无锡三城市在指标x5上量的加大所至,其进一步影响到了rsr分析中的lsd检验(见输出1),由单一指标量的变化导致了综合信息量的改变,显然掩盖了x1—x4的区别,形成虚假外像。
3 讨论
以统计学作为依据探讨高新技术经济指标量在不同城市间的差异,本文sas程序输出的样品聚类结果可知:由2006年高新技术经济指标量的不同,国内52个城市被分为4类。北京在四个指标上特异性的极大,单个成为一类,显然在该时段发展速度极快,是我国经济的龙头老大;上海等5个城市因为在5个指标上拥有较大的量,分为第二类,是被国内看好的经济快速发展地区;同样可见从陕西西安—安徽合肥被分配在第三类,处于经济指标量的中等水平; 其余统归于第四类, 即投资和产出较小的水平。在对《新中国五十年统计资料汇编》投资基本情况亦进行系统聚类及rsr分析可知:与本文的聚类个数或分档水平及城市位次排序有对应关系,那就是现阶段经济指标量的大小取决于当初国家对该地区经济投资量的大小。进一步表明,当前我国的经济状况由国家投资干预不同导致了发展不平衡,各个城市经济发展有差距,此后将导致各省、地区间经济差距加大,这种情况并非国家之福。改革开放已接近30年,我们的国家积累了雄厚的经济基础,“春风普度玉门关”不再是难事,“允许部分人先富起来”的时代已经过去;应该重点投资、扶持那些落后的地区,现在该到了‘让大家都富起来’的时代了。
附件1: 本文中的sas程序及数据。
data wxq1638;
label x1='企业数(个)' x2='从业人员(人)' x3='总产值(万元)' x4='总收入(万元)' x5='出口总额(万美元)';
input name $ x1-x5;
cards;
北京01 18096 791273 34494030 67440508 1372757
上海02 755 212826 24300539 30558567 1733320
南京03 224 124614 16706093 17840231 644267
苏州04 625 227153 15051445 17877969 2035204
无锡05 608 198099 16439279 16499135 1100719
深圳06 348 173975 16019289 16433413 750715
西安07 3200 211154 9576910 13799712 146025
长春08 831 93501 10606549 11061945 31762
杭州09 675 91363 8048624 10469991 622805
重庆10 828 175494 8413032 10530866 87037
武汉11 1066 162303 8894156 10040721 43055
天津12 3058 190533 7813575 9660105 307683
沈阳13 871 89648 7511859 9022057 80597
珠海14 427 136361 7919787 7932220 593162
大连15 1732 168323 7012902 8812556 214727
厦门16 180 56972 7355888 7329713 412918
长沙17 701 120828 6900152 7908490 64895
中山18 394 72902 6750980 7063968 459100
惠州19 168 96342 6407081 6430969 565611
青岛20 186 69255 6363647 6686428 167437
吉林21 607 83822 6137264 6524996 17940
济南22 380 85209 5874502 6658849 81411
太原23 659 87846 6088430 6380087 13456
淄博24 209 93898 6030097 6280917 91116
潍坊25 299 91428 5864095 6208671 79786
哈尔滨26 420 104230 5351392 6340349 34126
常州27 601 96464 5803154 5779497 147879
合肥28 274 78326 5379758 5869804 50719
威海29 187 59239 4764613 4912980 254879
成都30 425 117782 4004267 5223566 71435
郑州31 474 73825 4304489 4997533 22503
石家庄32 517 75368 4086518 5074703 26821
佛山33 98 64266 4449956 4361148 292794
大庆34 311 74000 4128376 4302896 6735
昆明35 97 39172 3723305 3929022 64347
南昌36 283 83479 3584484 3871561 33277
洛阳37 319 59047 3140039 3732085 40551
鞍山38 432 84285 3125372 3625968 11351
襄樊39 141 50402 3172386 3378559 8207
宝鸡40 246 66974 2770548 2773129 28523
南宁41 329 59824 2270106 3254103 12663
福州42 179 51097 2717280 2615222 87471
株洲43 169 45888 2630251 2754171 25478
绵阳44 112 47153 2467568 2610305 42954
包头45 427 95810 4309436 421538 45267
桂林46 247 65457 2203780 2200030 28751
保定47 136 39867 2144680 2224450 59558
兰州48 463 45399 1791077 2019362 5565
贵阳49 115 59305 1738651 1766671 21716
海南50 125 22415 1694149 1632433 15755
乌鲁木齐51 177 19798 504308 1172532 54634
杨凌52 104 13588 270047 397142 6999
;
proc cluster m=war nosquare;
id name;
var x1-x5;
proc tree;
run;
附件2: 用rsr法观察4类间差异的sas程序。
data wxq1638;
do g=1 to 52;
input name $ x1-x5;
output;
end;
cards;
数据同上
proc sort;by descending g;proc rank data=wxq1638 out=wxq1;var x1-x5;ranks r1-r5;
data wxq16;set wxq1;m=n(of r1-r5);sumg+dif(g);n=g+abs(sumg);drop sumg;rsr=sum(of r1-r5)/(m*n);proc rank data=wxq16 out=wxq163;var rsr;ranks rr;
data wxq168;set wxq163;proc sort data=wxq168;by rr;
data wxq1688;set wxq168;r=rr/n;if r=1 then r=(1-1/(4*n));if r^=1 then r=r;p=probit(r)+5;
if p <=4.90 then l=4;if p > 4.90 & p<=6.20 then l=3;if p>6.20 & p<=7.07 then l=2;if p>7.07 then l=1;
proc reg data=wxq1688;model rsr=p;
proc glm data=wxq1688;class l;model rsr=l/ss1 ss3;means l/hovtest;means l/dunnett snk lsd;
proc print data=wxq1688;run;