地区人均收入影响因素的计量分析 内容摘要:本文选取2002年相关的截面数据,应用计量经济学所学知识对根据经济理论选取的影响我国地区人均收入的各因素进行检验,并对其影响程度的大小进行定量分析,进一步明确和完善相关的经济学知识。 关键名词:地区人均收入 物质资本 人力资本 技术水平
一、问题来源 改革开放以来,中国经济释放了难以置信的增长潜力,以平均每年7%的惊人速度连续20年大幅增长,经济总体规模更是跃居前列,2003年人均GDP已超越1000美元。虽然整个经济规模的绝对值大幅度增长,然而有关经济学者通过研究发现我国东部沿海地区和中西部内陆地区之间,在经济发展水平方面,无论是绝对差距还是相对差距都还在扩大。那么地区间收入差距的影响因素具体是哪些,各因素的影响程度如何,本文选取了2002年的截面数据,应用计量经济学所学过的知识进行定量分析,试图回答以上的问题。
理论来源 从经济学的学习中可以发现,影响地区间收入分配的因素有各地区经济发展水平、税收结构、政府转移支付以及政府政策倾向等。其中,税收结构难以为其影响各地区程度的大小划分档次,因而不能确定何种地区为0、1,故未引入虚拟变量加以说明;政府转移支付主要是补贴与各种税收优惠,补贴因其补贴人群相对狭小,补贴数量少,不足以改变各省市人均收入的相对高低,而税收优惠即为企业利润,可以说包含在各地经济发展状况中,也不引入;而目前国家针对中、西、东部沿海地区均实行了不同的优惠政策,所以政策的影响也就被削弱了。且由现实经济情况可知人均可支配收入很大程度上是受到该地区经济发展水平的影响,综合数据搜集情况等因素,我组认为分析地区间收入分配差异的影响因素可以从分析影响经济发展水平的因素着手。 通过经济学各种理论的学习(如新经济增长模型),可以清晰的发现经济发展水平(Y)是物质资本(K)、人力资本(L)、技术水平(U)的函数,即Y=f(K,L,U)。于是,本文分析地区间收入分配的差异决定从资本、劳动力以及技术三方面寻找影响因素。
三 、影响因素的选取 鉴于以上说明,因素选取如下: 各省市固定资产投资总额 实际利用外商直接投资和外商其他投资。包括外企和经济组织或个人以现汇、实物等方式在我国开办企业或对我国各种企业的投资,以及股票发行价总额和设备、物料、技术的应收款等。 此两因素均是说明物质资本对收入的影响。 各地区就业人员高中或高中以上人口所占比重。因我国平均受教育程度为初中,所以在此选择各省市高中或高中以上劳动力人口(即高中、大专、本科、研究生及以上)占总劳动力人口的比率说明劳动力素质对收入分配的影响。 各省市科技筹集经费,包括财政中科技费用支出,各组织、研究所科技经费筹集与企业革新资金筹集,从重视技术开发程度的角度侧面说明各省市科学技术水平。因各种年鉴未统计各省市科技研发投入经费,故以此代替。 各省市第二产业产值。就我国而言,第二产业仍是经济发展的最大驱动力,借以说明经济规模对于人均收入分配的影响。
四 、数据处理(各数据见附表一、附表二、附表三)
各省市人均可支配收入。各年鉴没有直接统计的人均可支配收入,于是我组选取了各省市城市居民可支配收入、农村纯收入、各省市人口数(抽样)、农村人口数(抽样),通过计算得到农村和城镇人口比重,然后分别乘以城市居民可支配收入、农村纯收入,相加得到各省市人均可支配收入。为消除物价对于人均收入差距的影响,各省市人均可支配收入除以物价指数得实际各省市人均可支配收入。 2、 各地区就业人员高中或高中以上人口所占比重。查年鉴得就业人员中不识字、小学、初中人口比重,用1减去即得。
综上得模型各因素: Y-实际各省市人均可支配收入 X1-各省市固定资产投资总额 X2-各省市第二产业产值 X3-各地区就业人员高中或高中以上人口所占比重 X4-各省市科技筹集经费 X5-实际利用外商直接投资和外商其他投资
原始模型设定为:Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+ui
五、参数估计
1、对原始模型进行回归,结果为: Dependent Variable: Y Method: Least Squares Date: 12/18/04 Time: 15:10 Sample: 1 31 Included observations: 30 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. X5 0.002531 0.001272 1.989189 0.0582 X4 155.4323 28.25883 5.500309 0.0000 X3 0.000204 0.000722 0.282856 0.7797 X2 -1.470242 0.596051 -2.466636 0.0212 X1 2.436274 0.883700 2.756901 0.0110 C -38.32851 692.8780 -0.055318 0.9563 R-squared 0.830540 Mean dependent var 4829.185 Adjusted R-squared 0.795235 S.D. dependent var 2431.177 S.E. of regression 1100.130 Akaike info criterion 17.02110 Sum squared resid 29046879 Schwarz criterion 17.30134 Log likelihood -249.3165 F-statistic 23.52519 Durbin-Watson stat 1.767723 Prob(F-statistic) 0.000000 从表中发现在α=0.1时,虽然模型拟合效果较好,F检验显著,但X3的t检验不显著,X2系数的符号为负,与经济意义不服,则模型存在多重共线,故采用逐步回归法进行修正。 2、逐步回归 对X1、X2、X3、X4、X5单个回归后发现X4的拟合程度最好,结果为: Variable Coefficient Std. Error t-Statistic Prob. X4 167.1079 28.12136 5.942384 0.0000 C 1011.500 702.0177 1.440847 0.1603 R-squared 0.549073 Mean dependent var 4799.998 Adjusted R-squared 0.533524 S.D. dependent var 2395.831 S.E. of regression 1636.331 Akaike info criterion 17.70064 Sum squared resid 77649780 Schwarz criterion 17.79316 Log likelihood -272.3599 F-statistic 35.31192 Durbin-Watson stat 1.629401 Prob(F-statistic) 0.000002 再将其余解释变量逐个加入后,得结果为: Variable Coefficient Std. Error t-Statistic Prob. X4 192.6331 25.88308 7.442434 0.0000 X5 0.002343 0.000792 2.956930 0.0064 C -149.6733 633.1428 -0.236397 0.8149 R-squared 0.751001 Mean dependent var 4829.185 Adjusted R-squared 0.732557 S.D. dependent var 2431.177 S.E. of regression 1257.281 Akaike info criterion 17.20593 Sum squared resid 42680430 Schwarz criterion 17.34605 Log likelihood -255.0890 F-statistic 40.71708 Durbin-Watson stat 1.739272 Prob(F-statistic) 0.000000 继续加入,得结果: Variable Coefficient Std. Error t-Statistic Prob. X5 0.002324 0.000765 3.038838 0.0054 X4 161.2850 30.86117 5.226147 0.0000 X3 0.001194 0.000691 1.729598 0.0956 C 314.9939 667.4646 0.471926 0.6409 R-squared 0.776694 Mean dependent var 4829.185 Adjusted R-squared 0.750928 S.D. dependent var 2431.177 S.E. of regression 1213.330 Akaike info criterion 17.16369 Sum squared resid 38276420 Schwarz criterion 17.35052 Log likelihood -253.4554 F-statistic 30.14407 Durbin-Watson stat 2.073796 Prob(F-statistic) 0.000000 以及: Variable Coefficient Std. Error t-Statistic Prob. X5 0.001186 0.001261 0.940354 0.3560 X4 163.7937 30.77561 5.322193 0.0000 X3 0.001010 0.000706 1.430482 0.1650 X1 0.435934 0.385152 1.131850 0.2684 C -102.6452 759.5370 -0.135142 0.8936 R-squared 0.787579 Mean dependent var 4829.185 Adjusted R-squared 0.753592 S.D. dependent var 2431.177 S.E. of regression 1206.824 Akaike info criterion 17.18038 Sum squared resid 36410617 Schwarz criterion 17.41392 Log likelihood -252.7058 F-statistic 23.17274 Durbin-Watson stat 1.988861 Prob(F-statistic) 0.000000 可以发现,在加入了四个解释变量后,模型的回归效果不如只有解释变量X3、X4、X5时效果好,所以通过逐步回归后模型为Y=314.9939+0.001194 X3+161.285 X4+0.002324 X5 3、异方差检验 对Y=314.9939+0.001194 X3+161.285 X4+0.002324 X5进行检验得: White Heteroskedasticity Test: F-statistic 1.291175 Probability 0.301136 Obs*R-squared 11.02501 Probability 0.273998 当α=0.1时Obs*R-squared =11.02501>χ20 。1(3)=6.251,所以应拒绝原假设,认为模型存在异方差。在此,选择WLS法进行修正,权重W=1/e,修正结果为: Weighting series: W1 Variable Coefficient Std. Error t-Statistic Prob. X5 0.002097 0.000162 12.98028 0.0000 X4 88.53964 5.263924 16.82008 0.0000 X3 0.000317 0.000232 1.363482 0.1844 C 1930.229 72.50003 26.62384 0.0000 Weighted Statistics R-squared 0.999843 Mean dependent var 3521.571 Adjusted R-squared 0.999825 S.D. dependent var 23095.27 S.E. of regression 305.7747 Akaike info criterion 14.40714 Sum squared resid 2430953. Schwarz criterion 14.59397 Log likelihood -212.1071 F-statistic 602.7000 Durbin-Watson stat 0.146268 Prob(F-statistic) 0.000000 Unweighted Statistics R-squared 0.598751 Mean dependent var 4829.185 Adjusted R-squared 0.552453 S.D. dependent var 2431.177 S.E. of regression 1626.431 Sum squared resid 68777250 Durbin-Watson stat 1.608504 进行异方差检验为: White Heteroskedasticity Test: F-statistic 0.567448 Probability 0.807602 Obs*R-squared 6.102317 Probability 0.729636 此时Obs*R-squared=6.102317<χ20 。1(3)=6.251,则接受原假设,认为模型不存在异方差,且拟合程度高,然而X3的t检验却稍不显著,但此模型在所有模型中效果最好,且从本文的目的而言,也是可以选择此模型的。而此模型中Durbin-Watson stat =0.146268落在了正自相关区域,于是进行自相关修正。 4、自相关修正 在此,采用了迭代法,一次迭代后结果为: Dependent Variable: Y Method: Least Squares Date: 12/19/04 Time: 18:07 Sample(adjusted): 2 31 Included observations: 28 Excluded observations: 2 after adjusting endpoints Convergence achieved after 8 iterations Variable Coefficient Std. Error t-Statistic Prob. X5 0.002325 0.000823 2.825206 0.0096 X4 129.9258 31.46191 4.129624 0.0004 X3 0.003461 0.001481 2.337728 0.0285 C 679.4463 639.0971 1.063135 0.2988 AR(1) -0.268556 0.177017 -1.517122 0.1429 R-squared 0.725553 Mean dependent var 4653.799 Adjusted R-squared 0.677823 S.D. dependent var 2137.356 S.E. of regression 1213.177 Akaike info criterion 17.20030 Sum squared resid 33851345 Schwarz criterion 17.43820 Log likelihood -235.8043 F-statistic 15.20123 Durbin-Watson stat 1.925806 Prob(F-statistic) 0.000003 Inverted AR Roots -.27 此时模型拟合效果好,三个解释变量均通过了t检验,F检验显著,D-W=1.925806,非常接近于2,通过了自相关的检验。 综上,最终模型为Y=679.4463+0.003461X3+129.9258X4+0.002325X5
Y-实际各省市人均可支配收入 X3-各地区就业人员高中或高中以上人口所占比重 X4-各省市科技筹集经费 X5-实际利用外商直接投资和外商其他投资
六、对模型的几点说明
模型删去了X1-各省市固定资产投资总额和X2-各省市第二产业产值,虽然从经济意义上来看,此两因素均很重要,特别是X1,有资料显示固定资产投资的增加有力拉动了经济的快速增长。关于被删去的原因,经我组讨论后认为有三。第一,此两个因素的滞后效应是很强的,且滞后期常为3-5年,考虑到数据自由度的限制,模型没有引入滞后变量。第二,由于02年社会总供给大于社会总需求的宏观环境没能根本改观,投资能够转换为利润的比率不大,企业投资意向逐渐下降,工业企业内生性增长动力仍显不足,固定资产投资对经济的拉动作用被削弱。第三,龚六堂、谢丹阳研究我国各省份之间的生产要素配置的有效性问题后发现,从1970—1989年,资本的边际生产率的差异水平在缩小,从1989年起,边际生产率的差异水平保持在一个稳定水平;而劳动的边际生产率的差异水平反而开始上升。相比之下,固定资产投资对人均收入的影响比较不显著。 模型中X4-各省市科技筹集经费解释效果很好,可能与新一轮经济增长点多集中在新兴产业、高新技术产业及资金密集型产业,而传统的劳动密集型产业增长势头逐渐减弱有关。 外资投入较之固定资产投资而言,影响更为显著,因为自2002年年初我国正式加入WTO以后,跨国资本很快以空前的速度大量进入我国,2002年上半年全国外商投资协议额增加约40%,实际投资额增幅约为15%,为经济增长、人均收入的增加带来了直接的有力影响。
七、存在的问题
模型考虑因素不够完善,由于数据收集和实际操作性等问题的综合影响,未引入税收结构、政府转移支付以及政府政策倾向等,对地区人均收入差距这一问题的说明程度有所降低。 模型只是定性说明地区人均收入有差异,却无法定量说明差异的大小。 模型最终未包括各省市固定资产投资总额和第二产业产值的影响,且采集数据为2002年数据,分析上会出现一定的局限性。
八、简单政策取向
重视科技教育的投入,提高劳动力素质,建立完善的知识创新的激励和保护机制,进一步加强国家的基础教育的普及,中学及高等教育人群的扩大,以及大力发展职业培训等非专业教育体系等,为科技教育的发展创造健康的外部环境。 重视固定资产投资的质量,提高资本边际利润率,采取优惠政策引导资本向收益率高的产业的流动,有效的配置社会资源等。 继续加强外资的引入,注意外资投入结构,提高利用率等。 附表一
固定资产投资(亿元) 消费价格指数(%) 城市居民可支配收入(元) 农村纯收入(元) 实际利用外商直接投资和外商其他投资(万美元) 第二产业产值(亿元) 1796.14 98.2 12463.92 5398.48 172464 1116.53 807.51 99.6 9337.56 4278.71 158195 1001.9 2020.38 99 6679.68 2685.16 78761 3046 813.36 98.4 6234.36 2149.82 21164 1083.79 707.91 100.2 6051 2086.02 17701 728.34 1605.55 98.9 6524.52 2751.34 341168 2609.85 834.23 99.5 6260.16 2300.99 24468 978.37 1046.17 99.3 6100.56 2405.24 35511 2169.15 2213.72 100.5 13249.8 6223.55 427229 2564.69 3450.12 99.2 8177.64 3979.79 101896 5550.98 3477.47 99.1 11715.6 4940.36 30761 3982 1074.46 99 6032.4 2117.56 38375 1552.21 1253.08 99.5 9189.36 3538.83 383837 2159.94 889.04 100.1 6335.64 2306.45 108197 951.77 3483.31 99.3 7614.36 2947.65 48001 5309.54 1725.93 100.1 6245.4 2215.74 40463 2951.06 1605.06 99.6 6788.52 2444.06 164535 2446.05 1347.96 99.5 6958.56 2397.92 90022 1737.2 3850.78 98.6 11137.2 3911.9 1331132 5935.63 750.33 99.1 7315.32 2012.6 41726 863.96 225.41 99.5 6822.72 2423.2 51196 125.33 899.26 99.6 7238.04 2097.58 19704 827.55 1902.72 99.7 6610.8 2107.64 55583 1982.44 632.97 99 5944.08 1489.91 3821 474.68 814.61 99.8 7240.56 1608.64 11169 951.48 106.58 100.4 8079.12 1462.27 32.93 915.35 98.9 6330.84 1596.25 36005 925.78 526.21 100 6151.44 1590.3 6121 530.36 232.35 102.3 6170.52 1668.94 4726 154.01 226.98 99.4 6067.44 1917.36 2200 151.16 800.09 99.4 6899.64 1863.26 1899 627.1
附表二
人口数(人) 农村人口(人) 初中(%) 小学(%) 不识字(%) 科技筹集经费(十万元) 13723 2319 41.2 6.7 1.1 2200331 9961 2790 43.3 15.5 1.6 105512 66463 50144 49.7 24.1 4 114165 32455 20670 55.1 20.1 2.1 83911 23586 13231 41.1 23.5 10 35364 41608 20189 53.9 22.4 1.5 269571 22693 12477 45.1 25.3 1.5 153265 37806 18184 49 23.3 3.1 100111 16012 1871 39.2 11.5 2.7 609841 72966 39403 45.3 22.7 9.5 507375 45769 23928 39.6 30.1 7.7 121032 62783 43949 44.4 27.8 13.5 152179 34127 17076 36.4 32.3 8.5 55407 41521 25610 38.7 32.9 5.9 53486 89699 53072 47.4 19.1 6.5 164298 94793 70020 54.9 17.8 5 150576 59270 35418 34.8 33 11 272851 65434 44698 43.8 31.1 4.7 76929 77216 38298 47.6 20.6 2.5 261829 47504 36332 42.9 32.6 6 68895 7892 5098 48.3 17.8 5.6 25872 30724 20531 38.8 39.1 7.2 40546 85704 52562 38.4 36.3 7.7 594720 37686 27277 32.8 37.9 16.5 30403 42529 31962 27.1 46.4 19.4 83106 2609 1632 8.5 46.3 41.2 6925 36297 25086 39.5 28.3 11.9 510805 25546 19208 31.9 30.3 19.3 112682 5189 3345 30.4 36.1 23.2 9590 5585 3777 38.1 24.2 15.5 6630 19799 11557 35.1 27.9 6 48358
附表三
Y 11476.53 X1 1796.140 X2 1116.530 X3 2200331. X4 51.00000 X5 172464.0 7952.424 807.5100 1001.900 105512.0 39.60000 158195.0 3702.985 2020.380 3046.000 114165.0 22.20000 78761.00 3692.064 813.3600 1083.790 83911.00 22.70000 21164.00 3819.133 707.9100 728.3400 35364.00 25.40000 17701.00 4745.906 1605.550 2609.850 269571.0 22.20000 341168.0 4103.860 834.2300 978.3700 153265.0 28.10000 24468.00 4353.654 1046.170 2169.150 100111.0 24.60000 35511.00 12366.95 2213.720 2564.690 609841.0 46.60000 427229.0 5958.390 3450.120 5550.980 507375.0 22.50000 1018960. 8247.739 3477.470 3982.000 121032.0 22.60000 307610.0 3325.208 1074.460 1552.210 152179.0 14.30000 38375.00 6393.995 1253.080 2159.940 55407.00 22.80000 383837.0 3846.604 889.0400 951.7700 53486.00 22.50000 108197.0 4887.430 3483.310 5309.540 164298.0 27.00000 480010.0 3265.577 1725.930 2951.060 150576.0 22.30000 40463.00 4209.236 1605.060 2446.050 272851.0 21.20000 164535.0 3862.497 1347.960 1737.200 76929.00 20.40000 90022.00 7660.809 3850.780 5935.630 261829.0 29.30000 1331132. 3289.298 750.3300 863.9600 68895.00 18.50000 41726.00 4000.763 225.4100 125.3300 25872.00 28.30000 51196.00 3818.253 899.2600 827.5500 40546.00 14.90000 19704.00 3860.608 1902.720 1982.440 594720.0 17.60000 55583.00 2747.643 632.9700 474.6800 30403.00 12.80000 3821.000 3014.007 814.6100 951.4800 83106.00 7.100000 11169.00 3924.404 106.5800 32.93000 6925.000 4.000000 NA 3092.635 915.3500 925.7800 510805.0 20.30000 36005.00 2721.926 526.2100 530.3600 112682.0 18.50000 6121.000 3195.165 232.3500 154.0100 9590.000 10.30000 4726.000 3280.525 226.9800 151.1600 6630.000 22.20000 2200.000 3983.725 800.0900 627.1000 48358.00 31.00000 1899.00