浅析我国城市化的影响因素
内容摘要:本文根据我国城市化水平较低的现状,结合相关经济理论,试图利用计量经济模型分析影响我国城市化水平的因素,有利于我们通过出台相应的有针对性的政策措施来适度加快我国的城市化建设。通过查阅大量的关于城市化问题的资料,综合各方面的具体情况,在模型中我们引入了两个解释变量:人均国民生产总值和第一产业的从业人员比重;被解释变量设定为城市化率。从模型的回归分析结果中我们得到了一些有用的信息。
关键字:城市化 城市化率 人均国民收入 第一产业从业人员比重 一、问题的提出和形成 上世纪20年代,在许多研究著作中出现了“城市化”一词,当时是以人口、产业、建筑业作为城市化的标志,后来英国经济学家C·G克拉克把产业分为三类,指出城市应以第三产业占主要地位为标志,但在不同的学科,对城市化有不同的理解和界定。其中,经济学家侧重于由产业革命引起的人口在城市集中的角度阐述城市化。目前一般认为,城市化的主要原因是经济的发展和工业化,工业化是导致近代城市迅猛发展的根本动力。城市化有三个主要标志:城市人口的增加、城市人口在总人口中的比重上升、城市用地规模扩大。其中,城镇人口在总人口中的比重,通常被用来衡量一个国家或地区城市化水平的高低,是衡量城市化水平的最重要指标,而城市的人口和用地规模则反映了城市的发展是否合理。到上世纪70年代,西方发达国家的城市化发展水平已达到70%左右,然而根据统计资料显示,截至2000年第五次人口普查时,我国的城市化率仅为36.09%,远远低于欧美发达国家水平。作为世界上人口最多的发展中国家,中国要解决“三农”问题,要在未来20年实现建设小康社会的奋斗目标,要从整体小康顺利过度到全面小康,就必须加快城市化建设的步伐,发挥城市的中心作用。毫无疑问,城市化将成为中国经济的主要增长点,城市化将成为中国经济的主要推动力。因此,我们认为对城市化问题的研究是很有必要的。那么就我国的具体国情而言,究竟是那些因素在影响着城市化发展水平呢? 二、模型建立的相关经济学理论 根据城市经济学家的观点:城市发展的一般模式是生产部门的就业人口比率增长缓慢,到达顶峰,然后下降,随着城市的扩大,服务业比重始终呈上升趋势;中小城市具有强烈的专业倾向;在市场经济国家随着人均国民收入的增加城市化水平也会有所提高。结合我国的具体情况,在城市化进程中,从事农业生产的人口迅速减少,绝大部分农民进城之后从事服务、制造和建筑等劳动密集型行业,这部分劳动力转移的数据不好掌握,因此用农业从业人口比重的变动来衡量,而农业从业人员占了第一产业从业人员的绝对多数,所以在模型中我们引入数据较容易掌握的第一产业从业人员比重这个指标;同时,根据国外的实证分析数据,大致人均GNP在250美元左右时,城市化水平低于25%,如印度、印尼;人均GNP达到1500美元时,城市化水平达到50%左右,如土耳其、韩国;人均GNP>5000美元时,城市化水平达到70%左右,如西班牙、意大利、日本、加拿大、美国。因此我们有理由在模型中引入衡量人均财富水平的指标:人均国民收入(GNP)。其中的城市化水平我们用国际通行指标——城市化率——来衡量,即城镇人口数/总人口数。 到此为止,我们假定其他因素对城市化水平的影响很小可以忽略,设定被解释变量Y:城市化率(即城镇人口比重);两个解释变量分别为X1:人均国民收入;X2:第一产业从业人员比重。建立计量经济模型如下: 三、模型的设定
模型中各个变量的数据见附表1: 根据所收集的数据可以得到如下散点图:
从散点图中我们可以初步判断,两个解释变量和Y存在一定的线形关系。根据相关经济学理论和收集到的数据将模型设定为:
四、参数估计 由模型得多元线性样本回归方程为:
用Eviews估计,输出结果见附表2。
回归分析结果为:
t = (7.212922) (2.764166) (-4.310729) R2=0.943417 F=175.0671
将三个变量标准化后可得到:
五、模型检验 1. 经济意义的检验。 由回归分析结果可看出,各个参数的符号也与实际经济意义相符。通过模型我们认识到:城市化水平与人均GNP呈正相关,与第一产业从业人口比重呈负相关。而且,第一产业从业人员比重的影响更加显著。这与我们查阅的相关资料中,关于影响城市化水平因素的描述一致。 说明我国农村人口向城市的转移是影响城市化水平的最主要因素。
2. 统计推断检验。 方程整体的拟和:由修正的可决系数可知方程整体的拟和优度很好;F 统计量F=175.07,说明即使在=0.01的显著性水平下也是显著的。所以方程的整体拟和效果很好,说明X1,X2对Y的联合影响力显著。 参数的检验:X1,X2系数的t值都能通过显著性检验,只是X2系数的t值(t=-4.310729)在=0.01时,只能勉强通过t检验;x1的系数的t值(t=2.764166)则只能通过显著性水平=0.05的t检验。 由经验推断,当整体拟和效果很好,而个别参数的t检验显著性不强的时候很可能是因为x1,x2存在多重共线性。 3. 计量经济的检验。 (1)多重共线性检验。在经济现象中,许多变量存在内在联系,随着时间的变化往往存在共同的变化趋势。所以在时间序列数据中很可能发生多重共线性。 给出x1,x2的简单相关系数矩阵: X1 X2 X1 1 -0.928395 X2 -0.928395 1
由上表可知,X1、X2的相关系数很高,可以判断二者确实存在多重共线形。 (2) 异方差的检验: 利用ARCH检验法检验模型是否存在异方差。在滞后阶数p=3时,查表得给定下的临界值。Eviews输出结果见附表3。 由表得(n-p)R2=(24-3)* =14.11185 >,所以拒绝H0,表明模型中随机误差项存在异方差。 再分别令y单独对x1,x2回归,由其ARCH检验结果知x2更显著的引起异方差。在对模型进行修正之前,再用Glejser检验进一步对异方差进行检验,同时也为加权最小二乘法权数的确定提供信息。下面进行Glejser检验。 将残差的绝对值分别对X2,,1/ x2,1/,回归,见附表4,5,6,7。 分析上面的回归结果(解释变量1/ x2最显著),可以肯定原回归中存在异方差。并可以确定加权的权数为W=X2。 异方差的修正: 首先生成权数W,再用Eview得出加权最小二乘法的估计结果,,输出结果见附表8。 回归分析结果为: t = (9.018718) (2.403130) (-5.712068) R2=0.768187 F=202.6286 对比修正前后的两个模型,修正后的拟和优度明显降低,斜率系数相差甚微,但修正后的方差要小些,表明原来的模型确实高估了标准误差,各统计量的t值也都有所改善。说明异方差的程度被降低了。 六、存在的问题 模型中,我们的城市化率是以城镇人口占总人口的比重来衡量的,符合大多数经济学家的观点,但与社会学家、地理学家眼中的城市化概念难免有所差别。城市化是个系统性的过程,当然还会受到其他因素的影响,如城市规模,比如:特大城市和小城镇在城市化过程中的表现就存在较大差异,但考虑到将方方面面的因素都引入模型比较困难,因此,在我们的模型里没有对他们进行体现,这些因素的影响都包含在了随机扰动项里。我们分析,这可能就是导致残差表现不稳定,特别是90年后部分波动较大的一个原因。(残差图形见附表9) 如前所述,X1,X2确实存在多重共线形,我们分析可能是因为本来样本容量就较小,加之X1,X2又都是时间序列数据,随着时间共同变化发展而产生了共线。但是,根据我们查阅大量资料反映,两个变量确实都从不同角度对Y有重要影响,因此在模型中我们保留了这两个变量。 关于模型中的异方差。通过计量经济学的检验,我们知道并修正了模型中X2引起的异方差。但从修正后的残差图看出,模型前半段的拟和状况得到改善,后半段问题依然存在。(见附表10)分析原因,我们认为正如前面所说我们的模型很有可能缺失了某些解释变量,这些影响因素包含在随机扰动项里,使模型出现系统性波动。这一问题在模型的后半段中表现得更加突出。 由于我国统计体制的一些问题,许多数据长度不够,使模型中各个变量的数据无法达到大样本的要求。由于这些客观因素的限制,我们难以增大样本容量,这样就导致模型中可能存在一些无法完全解释的问题,如解释变量间的多重共线性以及随机扰动项的自相关。
参考文献:《计量经济学》 西南财经大学 庞皓 李南成 《2002年中国统计年鉴》 《2003年中国劳动统计年鉴》 《城市规划汇刊》 1994年第六期 作者:南京大学 林炳耀 《中国的“城镇化”道路与相关制度问题》 温铁军 国务院发展研究中心信息网 城市化专题
附表1: obs Y X1 X2 1978 17.9 379 70.5 1979 19 417 69.8 1980 19.4 460 68.7 1981 20.2 488.7888 68.1 1982 21.1 526.7053 68.1 1983 21.6 584.2458 67.1 1984 23 698.4600 64 1985 23.7 857.3558 62.4 1986 24.5 955.9250 60.9 1987 25.3 1102.262 60 1988 25.8 1354.455 59.4 1989 26.2 1512.769 60 1990 26.4 1638.449 60.1 1991 26.9 1882.885 59.7 1992 27.5 2288.185 58.5 1993 28 2932.729 56.4 1994 28.5 3915.500 54.3 1995 29. 4772.389 52.2 1996 30.5 5491.060 50.5 1997 31.9 5946.689 49.9 1998 33.4 6196.139 49.8 1999 34.9 6427.862 50.1 2000 36.2 6987.534 50 2001 37.7 7418.226 50
附表2: Dependent Variable: Y Method: Least Squares Date: 11/11/04 Time: 10:42 Sample: 1978 2001 Included observations: 24 Variable Coefficient Std. Error t-Statistic Prob. C 51.70132 7.167874 7.212922 0.0000 X1 0.000865 0.000313 2.764166 0.0116 X2 -0.463661 0.107560 -4.310729 0.0003 R-squared 0.943417 Mean dependent var 26.60833 Adjusted R-squared 0.938028 S.D. dependent var 5.500349 S.E. of regression 1.369269 Akaike info criterion 3.582899 Sum squared resid 39.37284 Schwarz criterion 3.730156 Log likelihood -39.99479 F-statistic 175.0671 Durbin-Watson stat 0.314926 Prob(F-statistic) 0.000000
附表3 ARCH Test: F-statistic 11.60938 Probability 0.000221 Obs*R-squared 14.11185 Probability 0.002757 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 11/12/04 Time: 08:27 Sample(adjusted): 1981 2001 Included observations: 21 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 0.526906 0.467039 1.128185 0.2749 RESID^2(-1) 1.553287 0.273987 5.669208 0.0000 RESID^2(-2) -1.327213 0.366193 -3.624351 0.0021 RESID^2(-3) 0.546302 0.279252 1.956307 0.0671 R-squared 0.671993 Mean dependent var 1.711025 Adjusted R-squared 0.614109 S.D. dependent var 2.394862 S.E. of regression 1.487691 Akaike info criterion 3.801971 Sum squared resid 37.62482 Schwarz criterion 4.000928 Log likelihood -35.92069 F-statistic 11.60938 Durbin-Watson stat 1.782194 Prob(F-statistic) 0.000221 附表4 Dependent Variable: E1 Method: Least Squares Date: 11/12/04 Time: 08:22 Sample: 1978 2001 Included observations: 24 Variable Coefficient Std. Error t-Statistic Prob. C -2.607535 1.133683 -2.300057 0.0313 1/X2 212.0112 65.69656 3.227128 0.0039 R-squared 0.321288 Mean dependent var 1.025347 Adjusted R-squared 0.290438 S.D. dependent var 0.779496 S.E. of regression 0.656613 Akaike info criterion 2.076211 Sum squared resid 9.485090 Schwarz criterion 2.174382 Log likelihood -22.91453 F-statistic 10.41436 Durbin-Watson stat 0.992587 Prob(F-statistic) 0.003876
附表5 Dependent Variable: E1 Method: Least Squares Date: 11/12/04 Time: 08:20 Sample: 1978 2001 Included observations: 24 Variable Coefficient Std. Error t-Statistic Prob. C 8.031902 2.306942 3.481623 0.0021 SQR(X2) -0.912328 0.299862 -3.042491 0.0060 R-squared 0.296152 Mean dependent var 1.025347 Adjusted R-squared 0.264159 S.D. dependent var 0.779496 S.E. of regression 0.668661 Akaike info criterion 2.112577 Sum squared resid 9.836373 Schwarz criterion 2.210748 Log likelihood -23.35092 F-statistic 9.256752 Durbin-Watson stat 0.964763 Prob(F-statistic) 0.005975