关于国内旅游需求的计量经济学分析报告
一、模型设定 根据旅游经济学理论,旅游需求是指在不同的价格水平下,旅游者愿意购买的旅游产品数量。旅游需求的主要影响因素包括:旅游者可支配收入、出游的偏好和动机、旅游产品的价格、非旅游消费品的价格、闲暇时间、旅游客源地与旅游目的地之间的距离,旅游地的安全状况和旅游地的形象等等。综合上述因素和变量的可观测性,我们首先建立一个多元线性回归模型: y=b0+b1x1+b2x2+b3x3+b4x4+b5x5+u 其中:y ——国内旅游需求,使用国内旅游出游数量衡量 x1——旅游者可支配收入,使用居民可支配收入衡量 x2——经济发展状况,使用GDP衡量 x3——旅游业发展状况,使用国内旅行社职工人数衡量 x4——旅游价格指数 x5——人口数量 b0,b1,b2,b3,b4,b5,回归系数;u为随机扰动项 收集数据如下表表示:
obs Y(万人) x1(元) x2(亿元) x3(人) x4 x5(万人) 1993 410 2577.4 34560.5 78172 114.7 118517 1994 524 3496.2 46670 77553 124.1 119850 1995 629 4282.95 57494.9 91592 117.1 121121 1996 640 4838.9 66850.5 87555 108.3 122389 1997 644 5160.3 73142.7 94829 102.8 123626 1998 695 5425.1 76967.2 100448 99.2 124761 1999 719 5854 80579.4 108830 98.6 125786 2000 744 6279.98 88254 164336 100.4 126743 2001 784 6859.6 95727.9 192408 100.7 127627 2002 878 7702.8 103935.3 229147 99.2 128453 2003 870 8472.2 116603.2 249802 101.2 129227 2004 1102 9422 136584.3 263245 103.9 129988
表1 二、估计参数与模型检验 1、直接对模型进行OLS法估计,结果如下: Dependent Variable: Y Method: Least Squares Date:05/29/05 Time: 11:21 Sample: 1993 2004 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C -29.02302 3247.894 -0.008936 0.9932 X1 0.031596 0.107402 0.294184 0.7785 X2 0.006083 0.005900 1.031121 0.3422 X3 -0.000625 0.000549 -1.139018 0.2981 X4 3.139470 3.530256 0.889304 0.4081 X5 -0.001390 0.025231 -0.055094 0.9579 R-squared 0.977694 Mean dependent var 719.9167 Adjusted R-squared 0.959105 S.D. dependent var 179.3065 S.E. of regression 36.26027 Akaike info criterion 10.32618 Sum squared resid 7888.843 Schwarz criterion 10.56863 Log likelihood -55.95705 F-statistic 52.59632 Durbin-Watson stat 3.131017 Prob(F-statistic) 0.000071 表2 2、分析 由上表我们看到解释变量t值不显著,而可决系数R和F统计量显著,说明极有可能存在多重共线性。 3、多重共线性检验 计算解释变量之间的简单相关系数,结果如下:
x1 x2 x3 x4 x5 x1 1 0.997478 0.940115 -0.67771 0.976511 x2 0.997478 1 0.928883 -0.67865 0.971951 x3 0.940115 0.928883 1 -0.52953 0.902582 x4 -0.67771 -0.67865 -0.52953 1 -0.79203 x5 0.976511 0.971951 0.902582 -0.79203 1 表3 由表3可以看出,解释变量之间存在严重的多重共线性。
4、多重共线性修正 (1)运用OLS法逐一求y对各个解释变量的回归,发现y对x1的线性关系很强,拟合度最好,如下: y=209.33+0.087x1 t (5.82) (14.95) se (35.96) (0.0058) R^2=0.957 S.E.=38.93 F=223.41212 逐步回归,将其余解释变量逐一代入: (2)将x2代入后, y=186.32+0.124x1-0.000462x2 t 6.31 0.438 1.5797 R^2=0.961 S.E.=36.305 F=129.659 R^2提高到了0.966,F统计量也有所提高,但对其它参数有明显影响b1下降到了0.033,此外代入x2后,t统计量的值大副下降,分别为b0:6.31,b1:0.438,b2:1.5797,因此决定舍去变量x2,保留x1。 (3)将x3代入后, y=186.32+0.124x1-0.000462x3 t 4.28286 5.96301 -0.95 R^2=0.961 S.E.=39.116 F=111.069 R^2提高到了0.9611, 但t统计量的值有所降低,而且该变量对y的影响很小,斜率系数只有 0.000462,故将该变量舍去。 (4)将x4代入后, y= -51.783+0.093x1+2.133x4 t -0.223223 11.92497 1.138959 R^2=0.962555 S.E.=38.359 F=115.67 R^2的值提高了,但是x4的t统计量并不显著,因为x4为旅游物价指数,因此我们发现x4的回归系数符号跟经济意义发生了背离,根据表一我们看到x1与x4的相关系数为-0.67771相关程度不高。因此推断有可能是模型的设定出现了偏差,或是数据不真实,或是模型遗漏了其它的重要影响变量。因此首先改变模型的形式,采用对数模型进行回归,回归结果如下: Dependent Variable: Y1 Method: Least Squares Date: 05/29/05 Time: 14:28 Sample: 1993 2004 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C -2.186992 1.468504 -1.489265 0.1706 Z1 0.750366 0.049570 15.13751 0.0000 Z4 0.487404 0.241165 2.021038 0.0740 R-squared 0.978856 Mean dependent var 6.550016 Adjusted R-squared 0.974158 S.D. dependent var 0.255534 S.E. of regression 0.041079 Akaike info criterion -3.334340 Sum squared resid 0.015187 Schwarz criterion -3.213113 Log likelihood 23.00604 F-statistic 208.3285 Durbin-Watson stat 2.633801 Prob(F-statistic) 0.000000 表5 回归系数符号跟经济意义仍然发生了背离。 用x4的平方值、立方值和开平方值进行回归,系数符号仍然没有改变。 于是猜想有可能是数据出现了偏差,因为由于没有直接的旅游价格指数,我们简单地使用了居民消费价格指数来代替旅游价格指数,于是改变旅游价格指数的衡量方式,首先采用交通价格指数来代替,回归后发现,系数符号仍然没有改变。再使用居民文娱价格指数来代替,回归后发现,系数符号也没有改变。此外,还有可能是缺失了某些重要的解释变量,留在异方差和自相关检验中进行分析。 (5)再将x5带入: Dependent Variable: Y Method: Least Squares Date: 05/29/05 Time: 14:45 Sample: 1993 2004 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 2394.378 1572.201 1.522946 0.1621 X1 0.122165 0.025856 4.724902 0.0011 X5 -0.019151 0.013777 -1.390133 0.1979 R-squared 0.964730 Mean dependent var 719.9167 Adjusted R-squared 0.956893 S.D. dependent var 179.3065 S.E. of regression 37.22815 Akaike info criterion 10.28433 Sum squared resid 12473.42 Schwarz criterion 10.40555 Log likelihood -58.70595 F-statistic 123.0886 Durbin-Watson stat 2.381878 Prob(F-statistic) 0.000000 表6 可以看出t统计量的值大副下降,而且x5的回归系数仅为0.019,对y影响很小,故舍去。 5、异方差检验 OLS估计法估计的参数为: Y = -51.78329206 + 0.09309258196*X1 + 2.133003771*X4 Dependent Variable: Y Method: Least Squares Date: 05/29/05 Time: 15:59 Sample: 1993 2004 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C -51.78329 231.9803 -0.223223 0.8283 X1 0.093093 0.007807 11.92497 0.0000 X4 2.133004 1.872765 1.138959 0.2841 R-squared 0.962555 Mean dependent var 719.9167 Adjusted R-squared 0.954233 S.D. dependent var 179.3065 S.E. of regression 38.35928 Akaike info criterion 10.34419 Sum squared resid 13242.91 Schwarz criterion 10.46541 Log likelihood -59.06513 F-statistic 115.6749 Durbin-Watson stat 2.359411 Prob(F-statistic) 0.000000 图示法 Goldfeld—Quandt检验 由于样本数目太少,不能用Quandt检验。 ARCH检验 Dependent Variable: E2 Method: Least Squares Date: 05/29/05 Time: 17:13 Sample(adjusted): 1996 2004 Included observations: 9 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 1878.275 1431.205 1.312373 0.2464 E2(-1) -0.257025 0.435899 -0.589644 0.5811 E2(-2) 0.033429 0.447524 0.074698 0.9434 E2(-3) -0.187427 0.431826 -0.434032 0.6824 R-squared 0.130019 Mean dependent var 1343.563 Adjusted R-squared -0.391970 S.D. dependent var 2274.618 S.E. of regression 2683.634 Akaike info criterion 18.92883 Sum squared resid 36009468 Schwarz criterion 19.01649 Log likelihood -81.17975 F-statistic 0.249083 Durbin-Watson stat 2.120898 Prob(F-statistic) 0.859007 计算(n-p)*R*R=(12-3)*0.130019*0.130019=0.1521444 它远远小于临界值。说明没有存在异方差。
6.自相关的检验 对模型:y=b0+b1x1+b4x4进行估计为: Dependent Variable: Y Method: Least Squares Date: 05/29/05 Time: 14:54 Sample: 1993 2004 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C -51.78329 231.9803 -0.223223 0.8283 X1 0.093093 0.007807 11.92497 0.0000 X4 2.133004 1.872765 1.138959 0.2841 R-squared 0.962555 Mean dependent var 719.9167 Adjusted R-squared 0.954233 S.D. dependent var 179.3065 S.E. of regression 38.35928 Akaike info criterion 10.34419 Sum squared resid 13242.91 Schwarz criterion 10.46541 Log likelihood -59.06513 F-statistic 115.6749 Durbin-Watson stat 2.359411 Prob(F-statistic) 0.000000 表7 图示法:
从图中看到,残差分布均匀,基本不存在自相关。 (2)DW检验 根据表7的统计结果,由DW=2.359411,对于给定的显著性水平a=0.05,查Durbin-Watson表,n=12,k’=2,得下限临界值dl=0.812,du=1.579,4-du=2.421,因为DW=2.359411大于du=1.579小于4-du=2.421,所以认为不存在自相关。
三、关于经济意义的检验 由表7看到x1的斜率系数为0.093,x4的斜率系数为2.133,从模型上来说,收入对旅游需求的影响为人均可支配收入每增加1000元,旅游需求增加93万人,符合经济意义。对于x4斜率系数为2.133003771,很明显该斜率系数的符号与经济意义不相吻合,模型中的系数意味着价格越高旅游需求越大,这完全违背的客观现实,然而单独用x4对y做回归我们看到: Dependent Variable: Y Method: Least Squares Date: 05/29/05 Time: 17:42 Sample: 1993 2004 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 2096.188 568.4445 3.687586 0.0042 X4 -13.00209 5.354854 -2.428094 0.0356 R-squared 0.370897 Mean dependent var 719.9167 Adjusted R-squared 0.307986 S.D. dependent var 179.3065 S.E. of regression 149.1603 Akaike info criterion 12.99893 Sum squared resid 222488.0 Schwarz criterion 13.07975 Log likelihood -75.99359 F-statistic 5.895640 Durbin-Watson stat 0.687758 Prob(F-statistic) 0.035566 表8 我们发现,这时候的斜率系数完全符合经济意义,但是可决系数很低,仅为0.370897。推断有可能是模型的设定出现了偏差,或是数据不真实,或是模型遗漏了其它的重要影响变量。 因此首先改变模型的形式,在进行共线性检验时,我们用x4的对数、平方值、立方值和开平方值进行回归,系数符号仍然没有改变。 于是猜想有可能是数据出现了偏差,因为由于没有直接的旅游价格指数,我们简单地使用了居民消费价格指数来代替旅游价格指数,于是改变旅游价格指数的衡量方式,首先采用交通价格指数来代替,回归后发现,系数符号仍然没有改变。再使用居民文娱价格指数来代替,回归后发现,系数符号也没有改变。在找不到旅游物价指数的情况下,这些数据都不能完全代替旅游物价指数,因此问题很有可能出在数据的误差上。 此外,由于该我们对该模型进行异方差和自相关检验的时候得出了该模型并不存在异方差和自相关。而在对x4进行单独回归的时候发现斜率系数完全符合经济意义,但是可决系数很低,仅为0.370897。此外,在模型中,x4的斜率系数为2.133003771,尽管不符合经济意义,然而可以看出它对旅游需求的影响很大,在单独回归中斜率系数甚至高达-13。综合上述分析,我们认为很有可能旅游需求与收入x1和价格x4之间存在的并非是线性关系,它们之间很有可能是一种非线性关系。
四、模型运用 由于无法通过经济意义的检验,该模型甚至与现实的经济理论相悖,因此该模型不能运用与实际的经济计量分析。然而上述分析也为旅游需求的分析提供了一些可能有用的思路,包括:旅游需求与可支配收入存在很大关系。研究旅游需求应该建立合理的旅游物价指数核算体系。最后,关于旅游需求与旅游物价之间存在的很有可能是一种非线性关系。