我国汽车需求的因素分析
2005年4月——6月 一、问题的提出 随着我国经济的持续、快速的增长,以及加入世界贸易组织后对外开放程度的不断加深,市场上对各种商品的需求也在与日俱增。汽车作为高档消费品,也随着市场经济的不断发展逐步走进了普通大众的生活。中国的汽车市场已俨然成为了各大汽车厂商必争的兵家之地。早已窥视许久的众多国际汽车巨头也加快了对中国汽车市场的争夺。然而,中国的汽车需求量到底有多大,会不会仅仅是GDP高速增长所产生的泡沫?面对国外各汽车巨头的大肆进攻,中国的汽车企业应如何应付?希望通过此次研究,能对我国的汽车需求量有更深入的认识,以解释以上提出的问题。 二、分析过程 为了应对入世后更为激烈的市场竞争,在更高层次上发展我国的民族汽车产业,切实把握我国汽车需求的影响因素是当务之急。而影响到汽车需求的因素是多方面的。因此,我们提取了我国成品钢产量,原油产量,铁路运输量,公路运输线路长度,国内生产总值GDP这五个对有较大影响的因素的时间序列数据来进行分析,希望通过建立一个合适的经济模型来从理论上找出影响汽车需求的最主要因素。 ㈠变量选取和具体数据: 应变量Y(我国的汽车需求量):假设在无存货的条件下,汽车的产量等于汽车的需求量,因此,用汽车的产量代替汽车需求量。 自变量X1(成品钢产量):钢铁是制造汽车的主要原料,使制造汽车的基础,是影响汽车产量的重要因素。因此也是影响汽车需求量的重要因素。 X2(原油产量):石油是汽车的动力之源,也是人们拥有汽车期间的一项重要支出。可见也在一定程度上影响着汽车的需求量。 X3(铁路运输量):对汽车的需求具有替代作用,从而制约了汽车的需求量。 X4(国内生产总值GDP):GDP反映了国民经济发展状况是影响汽车需求量的重要因素。 X5(公路运输线路长度):公路运输线路越长与汽车需求量是互补品,公路运输线路越长,越会刺激汽车的需求。 具体数据如下:(表1) Y (万辆) x1 (万吨) x2 (万吨) x3 (万吨) x4 (亿元) x5 (万公里) 1978 14.91 2208 10405 110119 3624.1 89.02 1979 18.57 2497 10615 111893 4038.2 87.58 1980 22.23 2716 10595 111279 4517.8 88.33 1981 17.56 2670 10122 107673 4862.4 89.75 1982 19.63 2902 10212 113532 5294.7 90.7 1983 23.98 3072 10607 118784 5934.5 91.51 1984 31.64 3372 11461 124074 7171 92.67 1985 43.72 3693 12400 130708 8964.4 94.24 1986 36.98 4058 13069 135636 10202.2 96.28 1987 47.18 4386 13414 140653 11962.5 98.22 1988 64.47 4689 13705 144948 14928.3 99.96 1989 58.35 4859 13764 151489 16909.2 101.43 1990 51.4 5153 13831 150681 18547.9 102.83 1991 71.42 5638 14099 152893 21617.8 104.11 1992 106.67 6697 14210 157627 26638.1 105.67 1993 129.85 7716 14524 162794 34634.4 108.35 1994 136.69 8428 14608 163216 46759.4 111.78 1995 145.27 8979.8 15004.95 165982 58478.1 115.7 1996 147.52 9338.02 15733.39 171024 67884.6 118.58 1997 158.25 9978.93 16074.14 172149 74462.6 122.64 1998 163 10737.8 16100 164309 78345.2 127.85 1999 183.2 12109.78 16000 167554 82067.5 135.17 2000 207 13146 16300 178581 89468.1 140.2698 2001 234.17 16067.61 16395.87 193189 97314.8 169.8 2002 325.1 19251.59 16700 204955 105172.3 176.52 2003 444.39 24108.01 16959.98 221178 117251.9 180.98 源于《中国统计年鉴》(1991年到2004年) 因为1978年我国正式实行改革开放,市场经济体制开始运行,所以以上选取的数据均是改革开放以后的(从1978年到2003年) ㈡建立模型: 首先我们运用EVIEWS软件分别计算了汽车产量Y和五个因素X1,X2,X3,X4,X5的相关系数。如下:(表2) Y X1 X2 X3 X4 X5 Y 1 0.994222603597 0.83079145818 0.935617461356 0.942516944958 0.963677396854 可以看到各相关系数的值都较大(在0.83以上),即反映了Y和X1,X2,X3,X4,X5各自都分别存在较强的线性相关关系。因此可以设定模型为 Y=C+β1X1+β2X2+β3X3+β4X4+β5X5+U (U为随机扰动项)
㈢ 模型的参数估计、检验及修正 1. 我们首先对表一中的数据进行最小二乘法估计,利用EVIEWS软件,得到以下输出框: (表3) Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:14 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 117.3741 24.08949 4.872418 0.0001 X1 0.027666 0.001894 14.61087 0.0000 X2 -0.004437 0.003246 -1.367086 0.1868 X3 0.000470 0.000328 1.431488 0.1677 X4 -3.88E-05 0.000181 -0.214807 0.8321 X5 -1.993328 0.244815 -8.142171 0.0000 R-squared 0.997708 Mean dependent var 111.6596 Adjusted R-squared 0.997135 S.D. dependent var 105.0325 S.E. of regression 5.622229 Akaike info criterion 6.490508 Sum squared resid 632.1893 Schwarz criterion 6.780838 Log likelihood -78.37660 F-statistic 1741.021 Durbin-Watson stat 1.907844 Prob(F-statistic) 0.000000 很明显可以看到,X2 、X4 、X5的系数的符号为负,首先从经济意义上是说不通的,因为原油产量,公路运输线路长度,国内生产总值GDP决不会与汽车需求成负相关关系;X3的系数的符号为正,也违背了经济意义,因为作为对汽车的需求具有替代作用的铁路运输量是不可能与汽车需求成正相关关系的。同时还可以看出,X2、X3 、X4的t值都不显著,但R^2很大, 则说明解释变量之间有可能存在多重共线性。为了验证我们的猜想,我们接下来对模型进行了检验。
2.计量经济学检验和修正 (1)多重共线性检验和修正 用EVIEWS软件,得相关系数矩阵表: (表4) X1 X2 X3 X4 X5 X1 1.000000 0.842973 0.939641 0.958631 0.985179 X2 0.842973 1.000000 0.954929 0.892616 0.831044 X3 0.939641 0.954929 1.000000 0.921692 0.922727 X4 0.958631 0.892616 0.921692 1.000000 0.952433 X5 0.985179 0.831044 0.922727 0.952433 1.000000 从上表可见,解释变量之间存在高度线性相关。下面利用逐步回归法(向上回归)进行修正 ①首先运用OLS方法逐一求Y对各个解释变量的回归(见表五,六,七,八,九) Y X1 (表5) Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:23 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -30.98913 3.869711 -8.008127 0.0000 X1 0.018687 0.000412 45.37706 0.0000 R-squared 0.988479 Mean dependent var 111.6596 Adjusted R-squared 0.987999 S.D. dependent var 105.0325 S.E. of regression 11.50645 Akaike info criterion 7.797495 Sum squared resid 3177.559 Schwarz criterion 7.894272 Log likelihood -99.36744 F-statistic 2059.078 Durbin-Watson stat 1.188765 Prob(F-statistic) 0.000000
Y X2 (表6) Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:24 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -413.9592 72.82550 -5.684262 0.0000 X2 0.038290 0.005236 7.312520 0.0000 R-squared 0.690214 Mean dependent var 111.6596 Adjusted R-squared 0.677307 S.D. dependent var 105.0325 S.E. of regression 59.66489 Akaike info criterion 11.08917 Sum squared resid 85437.58 Schwarz criterion 11.18594 Log likelihood -142.1592 F-statistic 53.47295 Durbin-Watson stat 0.283541 Prob(F-statistic) 0.000000
Y X3 (表7) Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:25 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -379.2737 38.53198 -9.843090 0.0000 X3 0.003250 0.000250 12.98405 0.0000 R-squared 0.875380 Mean dependent var 111.6596 Adjusted R-squared 0.870188 S.D. dependent var 105.0325 S.E. of regression 37.84270 Akaike info criterion 10.17856 Sum squared resid 34369.67 Schwarz criterion 10.27533 Log likelihood -130.3212 F-statistic 168.5855 Durbin-Watson stat 0.340479 Prob(F-statistic) 0.000000
Y X4 表8 Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:25 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 7.981907 10.27859 0.776556 0.4450 X4 0.002650 0.000192 13.81791 0.0000 R-squared 0.888338 Mean dependent var 111.6596 Adjusted R-squared 0.883686 S.D. dependent var 105.0325 S.E. of regression 35.82124 Akaike info criterion 10.06876 Sum squared resid 30795.87 Schwarz criterion 10.16554 Log likelihood -128.8939 F-statistic 190.9347 Durbin-Watson stat 0.508488 Prob(F-statistic) 0.000000
Y X5 表9 Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:26 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -307.6557 24.37611 -12.62120 0.0000 X5 3.708307 0.209779 17.67721 0.0000 R-squared 0.928674 Mean dependent var 111.6596 Adjusted R-squared 0.925702 S.D. dependent var 105.0325 S.E. of regression 28.62937 Akaike info criterion 9.620547 Sum squared resid 19671.38 Schwarz criterion 9.717324 Log likelihood -123.0671 F-statistic 312.4838 Durbin-Watson stat 1.233407 Prob(F-statistic) 0.000000 结合经济意义和统计检验选出拟合效果最好的一元线性回归方程。经分析在五个一元回归模型中汽车需求量Y对成品钢产量X1的线性关系强,拟合效果好,即 Y= -30.98913+0.018687 X1 (-8.008127) (45.37706) R-squared=0.988479 S.E.= 11.50645 F=2059.078
②逐步回归(向上回归)。将其余解释变量逐一代入上式(见表10,11,12,13): Y C X1 X5 表10 Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:29 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 126.8621 19.74964 6.423516 0.0000 X1 0.028637 0.001257 22.78305 0.0000 X5 -2.067694 0.257336 -8.035003 0.0000 R-squared 0.996974 Mean dependent var 111.6596 Adjusted R-squared 0.996710 S.D. dependent var 105.0325 S.E. of regression 6.024080 Akaike info criterion 6.537574 Sum squared resid 834.6595 Schwarz criterion 6.682739 Log likelihood -81.98846 F-statistic 3788.436 Durbin-Watson stat 1.499834 Prob(F-statistic) 0.000000 X5的系数符号为负,与经济意义不相符合,故将X5删去!
Y C X1 X4 表11 Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:28 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -34.58380 4.228626 -8.178498 0.0000 X1 0.021039 0.001387 15.17396 0.0000 X4 -0.000367 0.000207 -1.769341 0.0901 R-squared 0.989859 Mean dependent var 111.6596 Adjusted R-squared 0.988977 S.D. dependent var 105.0325 S.E. of regression 11.02738 Akaike info criterion 7.746807 Sum squared resid 2796.872 Schwarz criterion 7.891972 Log likelihood -97.70849 F-statistic 1122.500 Durbin-Watson stat 1.208524 Prob(F-statistic) 0.000000 X4的系数符号与经济意义不相符合,故将X4删去!
Y C X1 X3 表12 Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:28 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -35.66854 25.78966 -1.383056 0.1799 X1 0.018475 0.001229 15.03800 0.0000 X3 4.17E-05 0.000227 0.183611 0.8559 R-squared 0.988495 Mean dependent var 111.6596 Adjusted R-squared 0.987495 S.D. dependent var 105.0325 S.E. of regression 11.74532 Akaike info criterion 7.872954 Sum squared resid 3172.908 Schwarz criterion 8.018119 Log likelihood -99.34840 F-statistic 988.1044 Durbin-Watson stat 1.195906 Prob(F-statistic) 0.000000 X3 的t 值较小,说明X3对Y影响并不显著,故将X3删去!
Y C X1 X2 表13 Dependent Variable: Y Method: Least Squares Date: 05/13/05 Time: 15:27 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -18.06069 21.47972 -0.840825 0.4091 X1 0.019087 0.000776 24.60683 0.0000 X2 -0.001164 0.001902 -0.612177 0.5464 R-squared 0.988663 Mean dependent var 111.6596 Adjusted R-squared 0.987678 S.D. dependent var 105.0325 S.E. of regression 11.65932 Akaike info criterion 7.858256 Sum squared resid 3126.614 Schwarz criterion 8.003421 Log likelihood -99.15732 F-statistic 1002.905 Durbin-Watson stat 1.184452 Prob(F-statistic) 0.000000 X2 的T值较小,说明X2对Y影响并不显著,故将X2删去! 经过上述逐步回归分析,表明只含X1的回归模型为最优的。 (2)异方差检验和修正 采用Goldfeld-Quandt检验: 将观察值按解释变量的大小顺序排列 将排列在中间的大约1/4的观察值删除掉,除去的观察值个数记为c(c=6),余下的观察值分为两个部分,每部分的观察值个数为(n-c)/2=10。 提出检验假设 同方差性; 为异方差性 ② 分别对两部分观察值求回归模型,结果如下: (表14) Dependent Variable: Y Method: Least Squares Date: 05/25/05 Time: 22:16 Sample: 1978 1987 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C -21.25644 5.849972 -3.633597 0.0067 X1 0.015486 0.001812 8.544800 0.0000 R-squared 0.901251 Mean dependent var 27.64000 Adjusted R-squared 0.888908 S.D. dependent var 11.52949 S.E. of regression 3.842840 Akaike info criterion 5.707157 Sum squared resid 118.1393 Schwarz criterion 5.767674 Log likelihood -26.53578 F-statistic 73.01360 Durbin-Watson stat 2.209959 Prob(F-statistic) 0.000027 (表15) Dependent Variable: Y Method: Least Squares Date: 05/25/05 Time: 22:17 Sample: 1994 2003 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C -36.38926 15.40929 -2.361515 0.0458 X1 0.018983 0.001094 17.34839 0.0000 R-squared 0.974107 Mean dependent var 214.4590 Adjusted R-squared 0.970871 S.D. dependent var 98.68830 S.E. of regression 16.84346 Akaike info criterion 8.662658 Sum squared resid 2269.616 Schwarz criterion 8.723175 Log likelihood -41.31329 F-statistic 300.9665 Durbin-Watson stat 1.161093 Prob(F-statistic) 0.000000 并计算两部分的剩余平方和=118.1393与=2269.616,它们的自由度均为=8,k=2为估计参数的个数,于是构造
= 2269.616/118.1393=19.2113547312 在上式中,统计量F*服从F(8,8)分布。 ③判断。在给定显著性水平=0.05,查表得临界值F0.05=3.44,故F*>F0.05,表明第二部分的误差项方差大于第一部分的误差项方差,则拒绝,接受,即误差项存在异方差。 修正:运用模型的对数变换对异方差性进行修正,用OLS法求LNY对LNX的回归,其结果为(表16) Dependent Variable: LNY Method: Least Squares Date: 05/25/05 Time: 22:22 Sample: 1978 2003 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -8.277774 0.404941 -20.44192 0.0000 LNX1 1.441545 0.046340 31.10787 0.0000 R-squared 0.975799 Mean dependent var 4.282572 Adjusted R-squared 0.974791 S.D. dependent var 0.989425 S.E. of regression 0.157095 Akaike info criterion -0.790126 Sum squared resid 0.592294 Schwarz criterion -0.693349 Log likelihood 12.27164 F-statistic 967.6999 Durbin-Watson stat 0.773548 Prob(F-statistic) 0.000000
对修正后的模型进行异方差检验(Goldfeld-Quandt检验) 提出检验假设:H0:ui为同方差性;H1:ui为异方差性 分别对两部分观察值求回归模型,结果如下: (表17) Dependent Variable: LNY Method: Least Squares Date: 05/25/05 Time: 22:23 Sample: 1978 1987 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C -10.90142 1.485048 -7.340786 0.0001 LNX1 1.760390 0.184749 9.528549 0.0000 R-squared 0.919023 Mean dependent var 3.244150 Adjusted R-squared 0.908901 S.D. dependent var 0.404480 S.E. of regression 0.122083 Akaike info criterion -1.191378 Sum squared resid 0.119234 Schwarz criterion -1.130861 Log likelihood 7.956892 F-statistic 90.79325 Durbin-Watson stat 1.816480 Prob(F-statistic) 0.000012 (表18) Dependent Variable: LNY Method: Least Squares Date: 05/25/05 Time: 22:24 Sample: 1994 2003 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C -4.975072 0.545149 -9.126085 0.0000 LNX1 1.088861 0.057774 18.84680 0.0000 R-squared 0.977974 Mean dependent var 5.292838 Adjusted R-squared 0.975220 S.D. dependent var 0.386333 S.E. of regression 0.060815 Akaike info criterion -2.585113 Sum squared resid 0.029587 Schwarz criterion -2.524596 Log likelihood 14.92556 F-statistic 355.2018 Durbin-Watson stat 1.198604 Prob(F-statistic) 0.000000 两部分的剩余平方和=0.119234与=0.029587,它们的自由度均为8,k=2为估计参数的个数,于是构造
= 0.029587/0.119234=0.248142308402< F0.05(8,8)=3.44 故接受原假设,此时不再存在异方差
(3)自相关检验和修正 经过异方差检验和修正后,模型为 LnY=-8.277774+1.441545LnX1 (-20.44192) (31.10787) R-squared=0.975799 S.E.= 0.157095 F=967.6999 DW=0.773548
从模型设定来看,没有违背D-W检验的假设条件,因此可以用D-W检验来检验模型是否存在一阶自相关。 D-W检验:由回归结果得DW=0.773548,给定显著性水平0.05,查Durbin-Watson表的下限临界值1.072,上限临界值为1.222。可见DW=0.773548 < DL=1.072 ,所以判定存在一阶正自相关,需要进行修正。 采用广义差分法对模型进行修正: 由DW=0.773548 ,根据ρ=1-DW/2,计算出ρ=0.613226,用GENR分别对X和Y作广义差分。即: GENR DY= Y-0.613226*Y(-1) GENR DX= X-0.613226*X(-1) 修正为: DLNY=C+ C 1DLNX+u 修正的模型回归结果为: Dependent Variable: DLNY Method: Least Squares Date: 05/25/05 Time: 22:30 Sample(adjusted): 1979 2003 Included observations: 25 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C -0.041415 0.057266 -0.723211 0.4768 DLNX1 1.853226 0.523294 3.541463 0.0017 R-squared 0.352878 Mean dependent var 0.135787 Adjusted R-squared 0.324742 S.D. dependent var 0.169472 S.E. of regression 0.139262 Akaike info criterion -1.028302 Sum squared resid 0.446059 Schwarz criterion -0.930792 Log likelihood 14.85378 F-statistic 12.54196 Durbin-Watson stat 2.235509 Prob(F-statistic) 0.001743
由回归结果得DW=2.235509, DL=1.055 DU=1.211 故 DU<DW<4- DU DW值得到了改善,修正了一阶自相关 所以,我们确定的模型最终形式是DLNY=-0.041415+1.853226DLNX+u
三、总结 从经济意义角度,成品钢产量,原油产量,铁路运输量,公路运输线路长度,国内生产总值GDP都应该是对汽车产量有较大影响的因素。但从我们对模型的参数估计、检验和修正的结果来看,在多重共线性检验过程中,原油产量,铁路运输量,公路运输线路长度,国内生产总值GDP因素都没有通过检验而被删去,只留下了成品钢产量因素这个唯一变量。 经过我们的分析,我们认为这可能源于四方面的原因:①我们所选择的这几个经济变量在随时间的变化过程中往往存在共同的变化趋势。这使得它们之间容易产生多重共线性。②在模型设立过程中由于认识上的局限造成变量选择不当,也会引起变量之间的多重共线性。③数据本身的原因。统计数据的真实,有效性是我们不能控制的。④由于数据来源的局限我们设立的模型是封闭的,假定 年 份 我国原油生产总量 我国原油消费总量 两者差额 (万吨标准煤) (万吨标准煤) 1978 14876.49 12971.688 1904.802 1980 15168.93 12476.925 2692.005 1985 17879.114 13112.622 4766.492 1989 19616.327 16575.714 3040.613 1990 19745.18 16384.698 3360.482 1991 20130.048 17746.893 2383.155 1992 20271.384 19104.75 1166.634 1993 20768.033 21110.726 -342.693 1994 20896.304 21356.238 -459.934 1995 21419.644 22955.8 -1536.16 1996 22544.72 25010.64 -2465.92 1997 22906.93 28110.792 -5203.86 1998 22986.25 28426.01 -5439.76 1999 22916.46 30187.608 -7271.15 2000 23323.384 32053.062 -8729.68 2001 23454.6 32784.102 -9329.5 2002 23937.837 35528.8134 -11591 2003 24285.45 38107.38 -13821.9 不存在进出口问题,即我国汽车生产需要的成品钢,原油都是自己生产提供的,这与现实有一定偏差的。以1978年到2003年我国原油生产总量和消费总量相关数据为例(见左表),在1993年以前,中国的石油产量基本能够自给自足;但1993年以后原油的产量就逐渐不够消费需求了,且这个供需缺口在随着我国经济发展,汽车行业的成长而扩大。 同时我们发现,在对模型进行参数估计、检验及修正过程中,多重可决系数数值不断降低。经过多重共线性检验和修正,只留下X1作为变量,此时R^2为0.988479。 然后经过异方差检验和修正,R^2从0.988479变为0.975799,但通盘考虑模型的可靠度及其经济意义,我们认为适当降低可决系数的要求是可取的。最后经过自相关检验和修正,R^2急速降为0.352878,但考虑到作为回归方程显著性整体检验的指标F统计量12.54196还是比较显著,综合考虑定性的经济分析和定量的统计检验,我们最终接受了这个拟合结果,即: DLNY=-0.041415+1.853226DLNX+u ( -0.723211) (3.541463) R-squared=0.352878 S.E.= 0.139262 F=12.54196
参考文献:《中国统计年鉴》 1991-2002 《计量经济学》庞皓 西南财经大学出版社2002年8月第二版 《应用计量经济学》胡昌铸 陕西人民出版社 1991年1月第一版