计量分析软件课程论文
论文题目:基于多元线性回归模型的影响居民消费 水平相关因素分析 姓 名: 学 号: 学 院: 专 业: 联系电话:
年 月 日
基于多元线性回归模型的影响居民消费 水平相关因素分析
一、研究背景
中国GDP总量超越日本,成为仅次于美国的第二大经济体,但我国人均GDP依然很低,全球排名87位,这很大程度上制约了居民消费水平的提高。到2020年实现全面建成小康社会的目标,十八大明确提出提高居民人均收入和人均消费水平,共享改革开放成果。我国居民消费水平在改革开放后有了很大提高,但消费水平依然很低,消费量占GDP比重依然很小。为此,本文旨在根据全国经济宏观政策、国内生产总值、职工平均工资指数、城镇居民消费价格指数、普通中学及高等学校在校生数、卫生机构数和基本设施铁路公路货运量等因素的变化情况,来分析如何提高居民消费水平,以判断是否能使居民消费水平有很大的提高。本文通过对1978-2010年影响居民消费水平因素数据的分析,找到影响居民消费水平的主要原因,通过计量经济分析方法来建立合理的模型,探讨影响居民消费增长的长期趋势规律,并给政府提出合理的建议,以提高居民消费水平。
二、影响居民消费水平的因素
宏观经济模型GDPCIG(XM),经济发展应该紧紧抓住消费这一驾马车,而居民消费水平的高低受制于多种因素。凯恩斯消费理论认为居民消费主要受收入影响,我国居民消费一直很低,消费意愿不强,本文通过计量分析找到影响我国居民消费水平的主要因素,从根本上改善消费不足,促进我国经济的持续稳定健康发展。
消费分为居民消费和,居民消费包括农村居民消费和城镇居民消费。本文结合居民消费水平的影响因素,列出了国内生产总值、职工平均工资指数、城镇居民消费价格指数、普通中学及高等学校在校生数、卫生机构数和基本设施铁路公路货运量等相关因素,进行计量分析,得到回归模型。
三、居民消费水平模型的总体分析框架
(1)多元线性回归法OLS概述[1]
回归分析是计量经济分析中使用最多的方法,在现实问题研究中,因变量往往受制于多个经济变量的影响,通过统计资料,根据多个解释变量的最优组合来建立回归方程预测被解释变量的回归分析称为多元线性回归法。其模型基本形式为:
其中β0、β1、β2、β3…βk是k1个未知参数,称为多元回归系数。Y称为被解释变量,X1t、X2t、X3t…Xkt是k个可以精确测量和可控的一般解释变量,μt是随机误差项。当k2时,上式为多元线性回归模型。 (2)多元回归模型的建立
定义被解释变量和解释变量,被解释变量为居民消费水平(Y元),解释变量为国内生产总值(X1亿元)、职工平均工资指数(X2)、城镇居民消费价格指数(X3)、普通中学及高等学校在校生数(X4万人)、卫生机构数(X5个)和基本设施铁路公路货运量(X6万吨)。 (3)统计数据选取
本文所有数据均来自中国统计局和中国统计局外网中国统计年鉴。[2]
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
184 208 238 264 288 316 361 446 497 565
21261
169732 175142 180553 190126 193438 196017 198256 200866 203139 204960
195301 382929 493327 471336 492737 520197 657456 668771 755748 852077
1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 714 788 833 932 1116 1393 1833 2355 2789 3002 3159 3346 3632 3869 4106 4411 4925 5463 6138 7081 8349 9098 9968 205988 206724 208734 209236 204787 193586 191742 190057 322566 315033 314097 300996 324771 330348 306038 291323 297540 298997 308969 298408 297637 301122 316751 877263 885270 874721 886800 938568 1003050 1058130 1106369 1154884 1148685 1140313 1157998 1217394 1249501 1321280 1384205 1494007 1611074 1754571 1953669 1966731 1967983 1987111
在Eviews5中建立被解释变量和解释变量序列,如下图: 在新建的序列中输入数据,如下图:
四、构建计量模型
(1)根据被解释变量和解释变量,建立以下模型:
上式β0是常数,β1、β2、β3、β4、β5、β6是回归模型系数,u是随机变量。 (2)模型参数的估计
对于理论模型运用最小二乘法OLS 进行参数估计,估计结果如下图: 运用最小二乘法OLS估计模型的方程如下图: (3)计量模型统计检验
拟合优度和调整拟合优度:R0.997500,R0.997037,本模型的拟合效果很好。 t检验和F检验:在给定的显着性水平a0.05,n33,k6,查t分布表和F分布表得到临界值TO.O5(3361)2.056,F2773.326。由图建立如下方程:
原假设H0:β10 H1:β20
2由回归结果知tx123.86901t0.052.056,故拒绝原假设,X1能显着的解释居民消费水平Y;
同理,X2、X3的t值分别为(0.436146)、(0.610028)都比显着性水平
a0.05,n33,k6下得到的临界值TO.O5(3361)2.056要小,故接受原假设,X2、X3不能显着的解释居民消费水平Y;
X4、X5、X6的t值都比显着性水平a0.05,n33,k6下得到的
临界值TO.O5(3361)2.056要大,故拒绝原假设,X4、X5、X6能显着的解释居民消费水平Y。
其中R20.997500,说明被解释变量Y的变差被模型解释的比例为
0.9975,因此样本回归直线拟合度很好,但解释变量X2和X3的t检验不能通过,不能显着解释居民消费水平Y,可知此模型存在多重共线性。 (4)计量经济模型的检验与克服 ()多重共线性
通过eviews5查看各变量之间的相关系数,如下表:
cor(Y,X1)0.990946,cor(Y,X2)0.579478,cor(Y,X4)0.703038cor(Y,X5)0.765602,cor(Y,X6)0.952981,
由上式知Y与X1、X2、X4、X5、X6的相关系数都大于0.5,相关程度比较高,Y与X1的相关程度最高,达到了0.990946。 ()多重共线性的克服
利用eviews5分别将Y对X1、X2、X3、X4、X5、X6回归,
Y对X1进行线性回归得到RX10.981973。同理,Y分别X2、X3、X4、
2X5、X6进行线性回归,拟合优度分别为:
Y对X1的拟合优度最高,因此把GDP作为居民消费水平的第一个解释变量得到最初的回归模型Yβ0β1X1,然后向回归模型中分别引入X2、X3、X4、
X5、X6,得到最终的回归结果。
可以看出,不仅拟合优度提高了,且通过了t检验,多重共线性经过修正后的回归方程如下:
从回归结果知,解释变量均通过t检验,R20.994313说明拟合效果很好。各解释变量均符合经济意义,即居民消费水平主要受收入、卫生、价格等影响,随着它们的提高而提高。
异方差的检验 ①图示法检验
作残差resid与解释变量X1、X3、X5之间的散点图,图形如下:
(X1和resid的散点图)
(X3和resid的散点图) (X5和resid的散点图)
从残差resid与解释变量X1、X3、X5之间的散点图可以看出回归模型满足同方差的假定。
②怀特检验法
解释变量有X1、X3和X5,为了减少数据损失,采用没有交叉项的情形进行怀特检验。由检验结果可知nR22.982939,伴随概率
p0.566386,在a0.05的显着性水平下p0.05知,模型不存在异方差。
③ARCH检验法
由于样本数据是时间序列,故还可以用ARCH检验模型是否存在异方差,设置滞后期数p3,由于(n1)R21.988626,P0.702098,在显着性水平a0.05下p0.05,故模型中不存在异方差。
()序列相关性检验
①残差图,作出残差图如下:
作出残差与其自身前一期残差的散点图如下:
②依据德宾-沃森检验法,DW1.443229,n33,k3,a0.05的
显着性水平下,DW检验的临界值的下限与上限分别为dl1.258,du1.441,由于DW1.443229du1.441,故回归模型无一阶自相关。
③LM乘数法,拉格朗日乘数检验法是检验二阶序列相关性的方法,用eviews5软件计算结果如下:
从表中看出伴随概率p0.3074820.05,可知模型不存在二阶序列相关性。
由上述检验,回归模型已消除多重共线性,不存在异方差,无二阶自相关,最后的回归模型为:
五、回归模型估计结果的解释和评价
本文基于1978-2010 年居民消费水平和影响因素的相关数据,建立多元线性回归模型,居民消费水平和国内生产总值X1、城镇居民消费价格指数X3和卫生机构数X5之间存在高度相关。根据理论分析,职工平均工资指数
X2、普通中学及高等学校在校生数X4和基本设施铁路公路货运量X6存在
相关性,但由于与居民消费水平存在多重共线性,因此没有进入回归模型。
六、回归模型估计结果的经济含意
(1)由回归方程可知被解释变量和解释变量之间存在正向关系,回归模型中解释变量前的符号正好反映正向关系。 (2)β02432.924047没什么意义; β1dY0.02318933129,表明在其他条件不变时,国内生产总值dX1X1增长1个单位,居民消费就增加0.02318933129个单位;
β3dY12.97418061,表明在其他条件不变时,城镇居民消费价dX3格指数X3增长1个单位,居民消费就增加12.97418061个单位; β5dY0.007369432389,表明在其他条件不变时,卫生机构数X5dX5增长1个单位,居民消费就增加0.007369432389个单位。
(3)拟合优度R20.994313,表明被解释变量变差被解释变量解释的比例为0.994313,拟合程度较好。
(4)t值和F值都通过检验,不存在异方差、多重共线性和自相关。
七、政策建议
居民消费作为推动GDP增长的三驾马车之一,占GDP的比重很低而且不断下降,在2008年经融危机之后,我国外贸出口和国内投资增长缓慢,我国经济增长速度明显下滑,在此背景下,党中央国务院明确提出扩大国内消费,
提高居民消费水平。但是我国居民消费意愿很低,大量资金存入银行,在一定程度上源于他们承担的生活风险和压力不断增加。
因此,政府应在大力发展经济的同时努力增加居民收入,稳定消费价格指数,防止通货膨胀,在养老、医疗、教育和房价等方面出台相关配套政策,完善社会保障体系来减轻老百姓的生活压力,将部分储蓄转换为消费,最终扩大内需,拉动经济增长。 资料来源:
[1]计量经济学中级教程[M].第2版.清华大学出版社 [2]中国统计年鉴官网
[3]影响居民消费水平相关因素的计量分析
[4]于俊年 着 计量经济学软件-Eviews5的使用.对外经济贸易大学出版社
因篇幅问题不能全部显示,请点此查看更多更全内容