中国对美国进口总额的分析 中美两国,一个是发展中的大国,一个是经济、科技发达的大国,两国都有广阔的市场,经济互补性很强。现在中美两国间贸易往来十分频繁,美国是中国进口商品主要的来源地。目前,两国贸易额已达400多亿美元,比1979年增加了数十倍。中国是美国小麦、磷肥、木材的主要销售市场,是美波音公司的第四大用户,也是美国计算机、工业机械等产品的最大买主之一。中国从美国的进口逐年递增。美国已成为屈居日本之后的世界第二大中国进口来源国。中美各自的一些产品对对方市场的依赖性已初步形成。中国经济正在持续、快速地发展,发展的重点———交通、通信和能源等领域,正是美国的强项。中国市场的巨大潜力对美国有着非常大的吸引力。正是中美在经济利益上的一致性,为中美关系的改善和发展带来了历史性机遇,并成为双边关系的核心。因此,研究中国对美国的进口额是有现实意义的。 就基本的来说,一个国家的进口额应该和很多方面有关,例如进口国的失业率,关税,经济发展情况,与他国的贸易关系紧密程度,汇率等有关。于是,我们以Y作为中国对美国的进口额(亿元)为应变量,并且假设了几个解释变量,它们分别是X1中国的GOD(亿元),X2中国历年的贸易关税总额(亿元),X3人民币的汇率,X4居民平均消费水平(元),X5中国的人口数,X6失业率,以及X7它作为一个比较特殊的值来衡量中国与美国之间的贸易关系。中国与美国因为各种原因,两国间的关系时好时差,因此,构建模型时,也把这种原因也考虑了进去。当两国较好时,设其值为1,不好时其值为0。刚开始假设模型为Y=C+B1X1+B2X2+B3X3+B4X4+B5X5+B6X6+B7X7+U。我们再来验证该模型的可行性。
一.假设初始模型 obs Y X1 X2 X3 X4 X5 X6 X7 1991 426.2328 21617.80 187.2800 5.322700 896.0000 11.43330 2.300000 1.000000 1992 473.9395 26638.10 212.7500 5.514900 1070.000 11.58230 2.300000 0.000000 1993 977.4677 34634.40 256.4700 5.761900 1331.000 11.71710 2.600000 1.000000 1994 1849.662 46759.40 272.6800 506187.0 1746.000 11.85170 2.800000 1.000000 1995 2063.750 58478.10 291.8300 8.350700 2236.000 11.98500 2.900000 0.000000 1996 1343.149 67884.60 301.8400 8.314200 2641.000 12.11210 3.000000 0.000000 1997 1351.348 74462.60 319.4900 8.289800 2834.000 12.23890 3.100000 1.000000 1998 1397.775 78345.20 313.0400 8.279100 2973.000 12.36260 3.100000 1.000000 1999 1612.470 82067.50 562.2300 8.278300 3143.000 12.47610 3.100000 0.000000 2000 1851.311 89442.20 750.4800 8.278400 3397.000 12.57860 3.200000 1.000000 2001 2168.759 95933.30 840.5200 8.277000 3611.000 12.76270 3.200000 1.000000 数据参考:《中国对外贸易统计年鉴》2000年,2002年版 《中国统计年鉴》2000年,2002年版 《世界经济年鉴》2001年版 《国际统计年鉴》2001年版
1.用EVIEWS对各假设变量数据进行分析,得到下表:
Dependent Variable: Y Method: Least Squares Date: 12/14/03 Time: 12:39 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 52635.19 29398.73 1.790390 0.1713 X1 0.592195 0.219174 2.701935 0.0737 X2 2.305870 0.876673 2.630251 0.0783 X3 -0.000170 0.000673 -0.252057 0.8173 X4 -14.12895 4.879698 -2.895457 0.0627 X5 -4820.787 2455.986 -1.962873 0.1444 X6 1165.480 1570.306 0.742200 0.5118 X7 -478.8084 163.9709 -2.920080 0.0615 R-squared 0.963212 Mean dependent var 1410.533 Adjusted R-squared 0.877373 S.D. dependent var 589.1776 S.E. of regression 206.3192 Akaike info criterion 13.65199 Sum squared resid 127702.9 Schwarz criterion 13.94137 Log likelihood -67.08594 F-statistic 11.22114 Durbin-Watson stat 2.600491 Prob(F-statistic) 0.036258
从上表中可以看出,可决系数比较大,然而模型F检验值和各解释变量的T检验值都比较小,因此,可以判断出该模型存在着较大的多重共线性,异方差以及自相关等多种缺陷。所以,应当适当的改变一下变量的形式,使得调整后的模型拟合程度更好。 2.针对解释变量X1来说,可以先寻找Y与X1之间的关系。计算出LY=LnY以及LX1=LnX1。依次对其进行分析,找出在Y与X1,Y与LnX1,LY与X1,LY与LnX1之间哪一组的相关程度最高。(具体分析如表一至表四所示) Dependent Variable: Y Method: Least Squares Date: 12/14/03 Time: 10:36 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 333.4674 324.4520 1.027787 0.3309 X1 0.017519 0.004901 3.574775 0.0060 R-squared 0.586758 Mean dependent var 1410.533 Adjusted R-squared 0.540843 S.D. dependent var 589.1776 S.E. of regression 399.2336 Akaike info criterion 14.97994 Sum squared resid 1434487. Schwarz criterion 15.05228 Log likelihood -80.38965 F-statistic 12.77902 Durbin-Watson stat 1.004405 Prob(F-statistic) 0.005979 (表一) Dependent Variable: Y Method: Least Squares Date: 12/14/03 Time: 11:54 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C -8839.507 2445.733 -3.614257 0.0056 LX1 938.3851 223.6833 4.195151 0.0023 R-squared 0.661645 Mean dependent var 1410.533 Adjusted R-squared 0.624050 S.D. dependent var 589.1776 S.E. of regression 361.2528 Akaike info criterion 14.78000 Sum squared resid 1174532. Schwarz criterion 14.85234 Log likelihood -79.28999 F-statistic 17.59929 Durbin-Watson stat 1.107891 Prob(F-statistic) 0.002323 (表二) Dependent Variable: LY Method: Least Squares Date: 12/14/03 Time: 12:58 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 6.075063 0.288162 21.08211 0.0000 X1 1.73E-05 4.35E-06 3.966534 0.0033 R-squared 0.636119 Mean dependent var 7.136493 Adjusted R-squared 0.595688 S.D. dependent var 0.557642 S.E. of regression 0.354579 Akaike info criterion 0.927196 Sum squared resid 1.131539 Schwarz criterion 0.999541 Log likelihood -3.099580 F-statistic 15.73339 Durbin-Watson stat 0.801747 Prob(F-statistic) 0.003272 (表三) Dependent Variable: LY Method: Least Squares Date: 12/14/03 Time: 11:51 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C -3.190284 1.990972 -1.602375 0.1435 LX1 0.945410 0.182091 5.191953 0.0006 R-squared 0.749697 Mean dependent var 7.136493 Adjusted R-squared 0.721885 S.D. dependent var 0.557642 S.E. of regression 0.294081 Akaike info criterion 0.553044 Sum squared resid 0.778354 Schwarz criterion 0.625389 Log likelihood -1.041744 F-statistic 26.95637 Durbin-Watson stat 0.930376 Prob(F-statistic) 0.000570 (表四)
根据上述四表中的可决系数以及修正可决系数,可以看出在这里LY与LX的相关程度最好。按这种方法分别对其它变量进行比较分析。综合X2到X6的数据来看,采用LY=C +B1LX1+B2LX2+B3X3+B4LX4+B5X5+B6LX6+B7X7的这种拟合模型在目前来看最好。 二.分析初步调整后的模型 obs LY LX1 LX2 X3 LX4 X5 LX6 X7 1991 6.054986 9.981272 5.232605 5.322700 6.797940 11.43330 0.832909 1.0000000 1992 6.161080 10.19010 5.360118 5.514900 6.975414 11.58230 0.832909 0.0000000 1993 6.884965 10.45260 5.547012 5.761900 7.193686 11.71710 0.955511 1.0000000 1994 7.522758 10.75277 5.608299 506187.0 7.465083 11.85170 1.029619 1.0000000 1995 7.632280 10.97641 5.676171 8.350700 7.712444 11.98500 1.064711 0.0000000 1996 7.202772 11.12556 5.709897 8.314200 7.878913 12.11210 1.098612 0.0000000 1997 7.208858 11.21805 5.766726 8.289800 7.949444 12.23890 1.131402 1.0000000 1998 7.242637 11.26888 5.746331 8.279100 7.997327 12.36260 1.131402 1.0000000 1999 7.385523 11.31530 6.331911 8.278300 8.052933 12.47610 1.131402 0.0000000 2000 7.523649 11.40135 6.620713 8.278400 8.130648 12.57860 1.163151 1.0000000 2001 7.681910 11.47141 6.734021 8.277000 8.191740 12.76270 1.163151 1.0000000
1.用EVIEWS分析初步调整后的模型
Dependent Variable: LY Method: Least Squares Date: 12/14/03 Time: 19:41 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C -12.68302 18.18878 -0.697299 0.5358 LX1 7.529893 5.547309 1.357395 0.2677 LX2 0.473889 0.656284 0.722080 0.5224 X3 2.63E-07 6.62E-07 0.397941 0.7173 LX4 -8.585895 5.625967 -1.526119 0.2244 X5 -0.546899 2.419075 -0.226078 0.8357 LX6 7.038473 9.694717 0.726011 0.5203 X7 -0.223243 0.339400 -0.657759 0.5577 R-squared 0.954451 Mean dependent var 7.136493 Adjusted R-squared 0.848171 S.D. dependent var 0.557642 S.E. of regression 0.217287 Akaike info criterion -0.059937 Sum squared resid 0.141640 Schwarz criterion 0.229442 Log likelihood 8.329652 F-statistic 8.980499 Durbin-Watson stat 2.030704 Prob(F-statistic) 0.049289
和原来的模型相类似的,虽然可决系数比较大,但是可以看出,F检验值与T-检验值都比较小,只不过它比原来的模型改善了一些而已。为了得到更好的模型,我们继续对其进行分析改善。 三.测定假定模型的多重共线性 1.判断多重共线性的存在 LX1 LX2 X3 LX4 X5 LX6 X7 LX1 1.000000 0.818856 -0.110582 0.999231 0.959603 0.989617 0.032945 LX2 0.818856 1.000000 -0.161073 0.821418 0.924216 0.781124 0.126631 X3 -0.110582 -0.161073 1.000000 -0.137983 -0.192420 -0.051156 0.239045 LX4 0.999231 0.821418 -0.137983 1.000000 0.962421 0.986364 0.020917 X5 0.959603 0.924216 -0.192420 0.962421 1.000000 0.929060 0.113288 LX6 0.989617 0.781124 -0.051156 0.986364 0.929060 1.000000 0.107568 X7 0.032945 0.126631 0.239045 0.020917 0.113288 0.107568 1.000000
从上表可以看出,各变量之间确实存在计较大的多重共线性,其中以LX1与LX4为最大,居然高达0.999231。LX4与LX6也高到了0.986364,而LX1与其他很多变量的相关程度都比较大。右图也可以看出,LX1与其它不少变量的趋势变化很类似,甚至与LX4的变化趋势线几乎可以完全重合。 这些也都与现实经济意义相吻合。GDP是衡量一个国家经济状况的综合指标,它牵涉到居民的投资,储蓄,消费等等很多方面,它与其他很多变量相关也是情理之中;如果一个国家的GDP比较高,那么可以认为这个国家比较繁荣,进而人民的生活水平很高,那么消费水平也就很高了。因为LX1与LX4之间相关程度很高,我们可以认为,人民的消费水平在很大程度上取决于GDP,也即是取决于一个国家的经济水平。而LX4与LX5高度相关就更好解释了,社会失业率高的话,居民就不敢将很多钱用于消费。反之亦然。 2.消除共线性 逐一求LY对各个解释变量的回归,选出拟合效果最好的一元线性回归方程。
Dependent Variable: LY Method: Least Squares Date: 12/14/03 Time: 12:27 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 2.895722 0.716600 4.040918 0.0029 LX6 4.044159 0.679133 5.954887 0.0002 R-squared 0.797574 Mean dependent var 7.136493 Adjusted R-squared 0.775082 S.D. dependent var 0.557642 S.E. of regression 0.264464 Akaike info criterion 0.340746 Sum squared resid 0.629473 Schwarz criterion 0.413090 Log likelihood 0.125899 F-statistic 35.46068 Durbin-Watson stat 0.893408 Prob(F-statistic) 0.000214
在用EVIEWS对各变量进行分析后,可知LX6修正后的可决系数最大,这也说明了在中国对美国的进口中,最主要的决定因素是国内的失业率水平,并且它们之间呈正相关关系。 从右图来看,LX6与LY存在着比较明显的线性关系。LY与LX6同向变化,这也与事实相符。进口额增多,也即是指进口的商品增多,会冲击到国内的生产厂家,使得一些厂家无法立足,濒临破产,于是会出现大量的裁员现象,进而社会的失业率也就升高了。 将LX6作为进入回归模型的第一个解释变量,形成一元回归模型。再用同样的方法来选择第二个变量。
Variable Coefficient Std. Error t-Statistic Prob. C 2.782201 0.602755 4.615810 0.0017 LX6 4.108131 0.569878 7.208787 0.0001 X3 1.01E-06 4.60E-07 2.194359 0.0595 R-squared 0.873634 Mean dependent var 7.136493 Adjusted R-squared 0.842042 S.D. dependent var 0.557642 S.E. of regression 0.221629 Akaike info criterion 0.051372 Sum squared resid 0.392954 Schwarz criterion 0.159889 Log likelihood 2.717452 F-statistic 27.65405 Durbin-Watson stat 1.793108 Prob(F-statistic) 0.000255
加入X3修正后的可决系数高达0.842042,该值大于加入其它各格变量的修正可决系数,于是将X3作为第二个解释变量。这也说明了汇率是对美国进口中一个很关键的因素。
Dependent Variable: LY Method: Least Squares Date: 12/14/03 Time: 15:50 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 2.792599 0.613353 4.553005 0.0026 LX6 4.169755 0.584259 7.136822 0.0002 X3 1.11E-06 4.83E-07 2.300712 0.0549 X7 -0.125227 0.146671 -0.853797 0.4215 R-squared 0.885552 Mean dependent var 7.136493 Adjusted R-squared 0.836503 S.D. dependent var 0.557642 S.E. of regression 0.225481 Akaike info criterion 0.134125 Sum squared resid 0.355892 Schwarz criterion 0.278814 Log likelihood 3.262311 F-statistic 18.05443 Durbin-Watson stat 1.963033 Prob(F-statistic) 0.001127
在众多可决系数中,加入X7后的修正可决系数最大。但是这个值低于没加入第三个变量时的修正可决系数0.842042,于是可以决定模型最终为LY=C+B1X3+B2LX6+U
三.异方差的判定以及修正 1.判断异方差是否存在 obs LY X3 LX6 1991 6.054986 5.322700 0.832909 1992 6.161080 5.514900 0.832909 1993 6.884965 5.761900 0.955511 1994 7.522758 506187.0 1.029619 1995 7.632280 8.350700 1.064711 1996 7.202772 8.314200 1.098612 1997 7.208858 8.289800 1.131402 1998 7.242637 8.279100 1.131402 1999 7.385523 8.278300 1.131402 2000 7.523649 8.278400 1.163151 2001 7.681910 8.277000 1.163151
先采用图示法来辨别 从图片来看,异方差并不是很明显,于是再通过ARCH检验进一步判断。 ARCH Test: F-statistic 0.202192 Probability 0.822284 Obs*R-squared 0.568275 Probability 0.752663 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 12/14/03 Time: 16:32 Sample(adjusted): 1993 2001 Included observations: 9 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 0.048930 0.037532 1.303702 0.2401 RESID^2(-1) -0.237679 0.404877 -0.587041 0.5786 RESID^2(-2) 0.035013 0.410813 0.085229 0.9349 R-squared 0.063142 Mean dependent var 0.040993 Adjusted R-squared -0.249144 S.D. dependent var 0.071743 S.E. of regression 0.080184 Akaike info criterion -1.947795 Sum squared resid 0.038576 Schwarz criterion -1.882053 Log likelihood 11.76508 F-statistic 0.202192 Durbin-Watson stat 1.992098 Prob(F-statistic) 0.822284
从ARCH检验的分析表来看,模型不存在异方差。在a=0.05,自由度P=2,得到X2值为5.99,而(n-P)R*R=0.0359明显小于该值。所以可认为模型中不存在异方差。
四.自相关的判断与修正 1.首先采用图示法。 从右图来看,从E与E(-1)之间并没有存在着明显的自相关关系,于是这又需要进一步判断。
Dependent Variable: LY Method: Least Squares Date: 12/14/03 Time: 17:25 Sample: 1991 2001 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 2.782205 0.602753 4.615829 0.0017 X3 1.01E-06 4.60E-07 2.194369 0.0595 LX6 4.108128 0.569877 7.208803 0.0001 R-squared 0.873634 Mean dependent var 7.136493 Adjusted R-squared 0.842043 S.D. dependent var 0.557642 S.E. of regression 0.221628 Akaike info criterion 0.051368 Sum squared resid 0.392952 Schwarz criterion 0.159885 Log likelihood 2.717476 F-statistic 27.65418 Durbin-Watson stat 1.793109 Prob(F-statistic) 0.000255 表中的D-W的值为d=10793109。而查D-W统计表可以看出,在显著性水平a=0.05,n=11,k’=2时,dl=0.658, du=1.604。显然,du<d<4-du,即可以判断不存在一阶自相关。
于是,我们可以得出,最终的模型是LnY=2.782201+4.108131X1+(1.01E-0.6)LnX2+u (单位:亿元)
这也说明了,虽然我国对美国的进口总额与很多方面有关,但是归根到底,它与我国的失业率以及汇率关系为最大。对于我国来说进口与出口基本持平,略有顺差。失业率越大,则我国的通货膨胀越小,这是它比较有益的方面,但是带来的社会治安,政治稳定等方面的问题却不容忽视。我国的失业率已经比较大了,因此不应该以此来交换更多的进口。而汇率的升高也不利于我国的出口,所以无论是失业率还是汇率,两方面都不会有大的变化。所以今年来,可以预测我国对美国的进口不会有飞速的增长。