2016年河南科技大学选拔赛
承 诺 书
我们仔细阅读了数学建模选拔赛的规则.
我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。
我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。如有违反选拔规则的行为,我们将受到严肃处理。
我们选择的题号是(从A/B/C/D中选择一项填写): C
队员签名 :1. 刘世磊
日期: 年 月 日
2016年河南科技大学数学建模竞赛选拔
编 号 专 用 页
评阅编号(评阅前进行编号):
我国旅游业发展预测问题
摘要
近年来,随着经济的不断发展,开放程度的不断提高,我国旅游业得到快速发展,旅游逐渐成为人们主要休闲方式之一。旅游收入是衡量旅游业发展的重要指标之一。
通过1994年到2014年中国国内旅游的收入与时间的相关数据,做散点图,进行相关关系分析,建立国内旅游收入与时间的非线性回归模型,得到y=c+b^t。预测未来5年2015-2019年的国内旅游收入,分别为30227.73、35366.455、41378.74、48413.13、56643.36(亿元)
为优化所建立的国内旅游市场收入的模型,先对各个因素的样本数据进行相关性分析,发现各个因素之间具有高度相关,于是采用逐步回归的方法利用spss进行建模,得到模型一
y=−3255.321+10.835x1+5.99x3−20.060x4
,在模型一的基础上,我们有考虑时间对各个因素的影响,采用时间按序列分析的方法,利用sas得到各个因素与其滞后项的关系,再利用EViews进行建模得到模型二。得到优化改进后的旅游市场收入模型。
yt=−2910.027+0.302837yt−1+7.566093x1t−14.08207x2t+7.395051x3t
关键字:时间序列、逐步回归、多元回归、sas、spss、EViews
近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放以来,特别是进入20世纪90年代以后,中国的国内旅游收入年增长14.4%,远高于同期GDP 9.76%的增长率。1994年到2014年中国旅游收入及相关数据如表1所示。为了规划中国未来旅游产业的发展,请根据表1提供的数据,解决以下问题:
1. 建立我国国内旅游市场收入的回归模型并预测未来5年内我国国内旅游市场收入的情况;
2.考虑其它国内旅游市场收入的影响因素,建立我国国内旅游市场收入的模型。(中国统计年鉴2015版自己查找)
问题一
针对1994年到2014年中国旅游收入的相关数据,建立国内旅游市场收入的回归模型,先做时间t与旅游收入y的散点图,若发现y与t存在非线性相关关系,进而利用SPSS对y与t做非线性回归模型,得到模型y=c+b^t。利用建立的模型预测未来5年的国内旅游收入。
问题二
优化所建立的国内旅游市场收入的模型,先对各个因素的样本数据进行相关性分析,发现各个因素之间具有高度相关,于是采用逐步回归的方法利用spss进行建模,得到模型一,在模型一的基础上,我们有考虑时间对各个因素的影响,采用时间按序列分析的方法,利用sas得到各个因素与其滞后项的关系,再利用EViews进行建模得到模型二。得到优化改进后的旅游市场收入模型。
三、问题假设
1、所给数据都近似符合正太分布的假定
2、假设所收集到的数据真实、准确、稳定、科学,没有较大的误差
四、符号定义与说明
五、模型的建立与求解
第一问模型
1、数据预处理:
建立时间t与国内旅游收入y的散点图如下
图一、国内旅游收入y与时间t的关系图
根据散点图可知,国内旅游随时间有较快的增长,因此利用SPSS建立时间t与国内旅游收入y的回归摸型。
统计量F-statistic=834.224,Prob(F-statistic)=0.0000
拟合优度:R-squared=0.989且调整后的Adjusted R-squared=0。977,说明模型具有很高拟合优度,所建模型为很好的非线性模型;
参数检验:通过参数检验可知,所有参数(Pr
用模型进行拟合得如下结果:
第二问模型
(1)多元线性分析
对影响国内旅游收入的五个因素之间的关系分析国内旅游人数x1(百万人次)、城镇居民人均旅游支出x2(元)、农村居民人均旅游支出x3(元)、公路里程x4(万公里)、铁路里程x5(万公里)关系分析
图三、各个因素的相关系数图
由上图可知,各个因素之间具有高度的相关性,如果直接用所有数据去建立回归模型的话,易产生因素之间的共线性。因此,我们决定用采用逐步回归的方法建立回归模型。利用SPSS软件得如下结果:
图四、模型一的参数检验
由上面图的过程可知,我们最终得到的模型为模型3,再对模型进行F检验结果如下:
由上可知模型的拟合优度R=0.998,调整的拟合优度R=0.996,模型的拟合优度较好,且F检验(p
再对残差进行检验得P-P 图
图五、残差的正态性检验图
由P-P图知,模型的残差服从正态分布。进一步验证模型可用。 因此,最终模型一为:
y=−3255.321+10.835x1+5.99x3−20.060x4
(2)时间序列分析
由模型知,影响国内旅游收入的主要因素为旅游人数、农村旅游消费以及公路里程。因为所给数据为时间序列数据,所以我们又在模型的基础上考虑时间对各个因素之间的影响。因此,我们又利用SAS软件对各个因素进行时间序列分。以国内旅游收入为例: (1)建立时序图:
图六、国内旅游收入的时序图
根据时序图可以看出,2004-2014年国内旅游收入数据具有明显的上升趋
势,数据为非平稳序列,于是对数据进行一阶差分,得一阶差分时序图如下:
图七、国内旅游收入一阶差分时序图
根据时序图可以看出,2004-2014年国内旅游收入一阶差分仍具有明显的上升趋势,数据为非平稳序列,于是对数据进行二阶差分,得二阶差分时序图如下:
图八、国内旅游收入二阶差分时序图
从二阶差分时序图可以看出,国内旅游收入二阶差分的时序图已经没有 明显的上升趋势,呈平稳分布。因此对数据进行单位根检验如图:
图九、国内旅游收入二阶差分的单位根检验
由单位根检验可知,
Rho统计量、
Tau统计量和F统计量的概率值Pr都小于0.01,因此可以得出国内旅游收入二阶差分具有平稳性。对国内旅游收入进行纯随机性检验如下:
通过白噪声检验,6阶的Chi-square统计量的概率值Pr>0.01,因此不能拒绝原假设,但造成这种情况的原因是因为样本数据量太少,因此我们通过时序图判断国内旅游收入不具有随机性,可以对其建立ARIMA模型。 利用SAS软得到序列的自相关图和偏自相关图如下:
图十、国内旅游收入的自相关图
图十一、国内旅游收入的偏自相关图
由自相关图和偏自相关图可知,国内旅游收入的偏自相关系数在延迟一阶之后迅速衰减到两倍标准误之内,因此可以建立AR(1)模型。
综上可知国内旅游收入与一阶国内旅游收入具有高度的相关性,当年国内旅游收入受到上年国内旅游收入的影响。
对其它因素用一样的方法分析得:
图十二、国内旅游人数的自相关图
图十三、国内旅游人数的偏自相关图
国内旅游人数与一阶国内旅游人数具有高度的相关性,当年国内旅游人数受到上年国内旅游人数的影响。
图十四、农村旅游消费的自相关图
图十五、农村旅游消费的偏自相关图
由自相关图和偏自相关图可知,农村旅游消费的自相关系数和偏自相关系数在一阶及之后都在两倍标准误之内,因此不可以建立AR(p)模型。 综上可知农村旅游消费与一阶农村旅游消费不具有高度的相关性,当年农村旅游消费不受到上年农村旅游消费的影响。
图十六、公路里程的自相关图
图十七、公路里程的偏自相关图
公路里程与一阶公路里程具有高度的相关性,当年公路里程受到上年公路里程的影响。
(3)模型建立
由以上的分析可知,国内旅游收入、一阶国内旅游收入与国内旅游人数 、一阶国内旅游人数、公路里程 、一阶公路里程以及农村旅游之间有高度的相关关系,因此可以建立美国内旅游收入、一阶国内旅游收入与国内旅游人数 、一阶国内旅游人数、公路里程 、一阶公路里程以及农村旅游的线性模型。
为了建立线性模型,首先对数据进行正态性检验(P-P图)。文章的开始,我们已经检验过,数据符合正态性。
利用Eviews软件,建立模型如下:
模型的F检验:
统计量F-statistic=1303.110,Prob(F-statistic)=0.0000
R-squared=0.9984685且调整后的Adjusted R-squared=0。997701,说明模型具有很高拟合优度,所建模型为很好的线性模型; 序列相关性检验:
Durbin-Watson=1.749331,说明模型不具有序列相关性; 参数检验:
通过参数检验可知,参数x1t−1、参数x2t−1以及参数x3t(Pr>0.05)不显著外,其余参数(Pr
因此,去掉参数x1t−1、参数x2t−1以及参数x3t再进行建模。 去掉参数x1t−1,进行建模得如下模型、模型检验及参数估计:
模型的
F检验:
统计量F-statistic=1508.69,Prob(F-statistic)=0.0000
拟合优度:
R-squared=0.99828且调整后的Adjusted R-squared=0.997618,说明模型具有很高拟合优度,所建模型为很好的线性模型;
序列相关性检验:
Durbin-Watson=1.648502,说明模型不具有序列相关性; 参数检验:
通过参数检验可知,参数x2t−1和参数x3t(Pr>0.05)不显著外,其余参数(Pr
去掉参数x2t−1,进行建模得如下模型、模型检验及参数估计:
模型的F检验:
统计量F-statistic=1614.360,Prob(F-statistic)=0.0000
拟合优度:
R-squared=0.997837且调整后的Adjusted R-squared=0.997219,说明模型具有很高拟合优度,所建模型为很好的线性模型;
序列相关性检验:
Durbin-Watson=1.795097,说明模型不具有序列相关性; 参数检验:
通过参数检验可知,所有参数(Pr
yt=−2910.027+0.302837yt−1+7.566093x1t−14.08207x2t+7.395051x3t
六、模型评价
模型的优点
1) 具有很好的创新性,在对传统模型的理解的基础上,取模型之长,考虑时间
因素对其他变量的影响,对未来5年内国内旅游收入进行了较为准确的预测; 2) 解决问题的思路宽阔,所建立的模型,可以在不同时期,结合当前具体情况,
对问题进行求解,使该模型具有很好的推广性和通用性;
3) 该模型中所涉及的数据均来自“中国统计局”官方数据,并且对论文中涉及
到的众多影响因素进行了量化处理,使得论文的说服力强; 4) 采用采用逐步回归法建模,得到的模型较为全面、简洁、直观。
模型的缺点
1) 影响国内旅游收入的因素很多,而且不可能都能涉及到,所以模型与实际还
是有一些差距的;
2) 基于模型的假设,数据选取的有限性,因此预测的结果存在一定的误差.
参考文献
[1] 阮晓青,周义仓,数学建模引论,北京:高等教育出版社,2010
[2] 盛骤,谢式千,潘承毅,中国旅游收入研究,北京,高等教育出版社,2010 [3] 高祥宝,董寒青.数据分析与SPSS应用.北京:清华大学出版社,2007.6 [4] 徐全智,杨晋浩,数学建模,北京:高等教育,2008
[5] 司守奎,孙玺菁,关于旅游收入的计量经济学研究,北京:国防工业出版社,2013.2
[6] 梁冯珍,宋占杰,张玉环.中国入境旅游市场回归预测模型,天津:天津大学出版社,2004
[7] 曾小鱼,郑娟,曾文军,全国旅游收入预测分析[J],高等函授学报,2008 [8] 李永胜,旅游收入预测中的模型选择与参数认定[J],财经科学,2004
附件
SAS部分程序代码
以国内旅游人数为例: data a; input lysr;
time=intnx('year','01jan1978'd,_n_); difx=dif(dif(lysr)); format time year.; cards; 1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9 ; run;
proc gplot data=a;
plot gdp*time=1 difx*time=2; run;
proc arima data=a;
identify var=difx stationarity=(adf=2) minic p=(0:5) q=(0:5); estimate p=1; run;
2016年河南科技大学选拔赛
承 诺 书
我们仔细阅读了数学建模选拔赛的规则.
我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。
我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。如有违反选拔规则的行为,我们将受到严肃处理。
我们选择的题号是(从A/B/C/D中选择一项填写): C
队员签名 :1. 刘世磊
日期: 年 月 日
2016年河南科技大学数学建模竞赛选拔
编 号 专 用 页
评阅编号(评阅前进行编号):
我国旅游业发展预测问题
摘要
近年来,随着经济的不断发展,开放程度的不断提高,我国旅游业得到快速发展,旅游逐渐成为人们主要休闲方式之一。旅游收入是衡量旅游业发展的重要指标之一。
通过1994年到2014年中国国内旅游的收入与时间的相关数据,做散点图,进行相关关系分析,建立国内旅游收入与时间的非线性回归模型,得到y=c+b^t。预测未来5年2015-2019年的国内旅游收入,分别为30227.73、35366.455、41378.74、48413.13、56643.36(亿元)
为优化所建立的国内旅游市场收入的模型,先对各个因素的样本数据进行相关性分析,发现各个因素之间具有高度相关,于是采用逐步回归的方法利用spss进行建模,得到模型一
y=−3255.321+10.835x1+5.99x3−20.060x4
,在模型一的基础上,我们有考虑时间对各个因素的影响,采用时间按序列分析的方法,利用sas得到各个因素与其滞后项的关系,再利用EViews进行建模得到模型二。得到优化改进后的旅游市场收入模型。
yt=−2910.027+0.302837yt−1+7.566093x1t−14.08207x2t+7.395051x3t
关键字:时间序列、逐步回归、多元回归、sas、spss、EViews
近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放以来,特别是进入20世纪90年代以后,中国的国内旅游收入年增长14.4%,远高于同期GDP 9.76%的增长率。1994年到2014年中国旅游收入及相关数据如表1所示。为了规划中国未来旅游产业的发展,请根据表1提供的数据,解决以下问题:
1. 建立我国国内旅游市场收入的回归模型并预测未来5年内我国国内旅游市场收入的情况;
2.考虑其它国内旅游市场收入的影响因素,建立我国国内旅游市场收入的模型。(中国统计年鉴2015版自己查找)
问题一
针对1994年到2014年中国旅游收入的相关数据,建立国内旅游市场收入的回归模型,先做时间t与旅游收入y的散点图,若发现y与t存在非线性相关关系,进而利用SPSS对y与t做非线性回归模型,得到模型y=c+b^t。利用建立的模型预测未来5年的国内旅游收入。
问题二
优化所建立的国内旅游市场收入的模型,先对各个因素的样本数据进行相关性分析,发现各个因素之间具有高度相关,于是采用逐步回归的方法利用spss进行建模,得到模型一,在模型一的基础上,我们有考虑时间对各个因素的影响,采用时间按序列分析的方法,利用sas得到各个因素与其滞后项的关系,再利用EViews进行建模得到模型二。得到优化改进后的旅游市场收入模型。
三、问题假设
1、所给数据都近似符合正太分布的假定
2、假设所收集到的数据真实、准确、稳定、科学,没有较大的误差
四、符号定义与说明
五、模型的建立与求解
第一问模型
1、数据预处理:
建立时间t与国内旅游收入y的散点图如下
图一、国内旅游收入y与时间t的关系图
根据散点图可知,国内旅游随时间有较快的增长,因此利用SPSS建立时间t与国内旅游收入y的回归摸型。
统计量F-statistic=834.224,Prob(F-statistic)=0.0000
拟合优度:R-squared=0.989且调整后的Adjusted R-squared=0。977,说明模型具有很高拟合优度,所建模型为很好的非线性模型;
参数检验:通过参数检验可知,所有参数(Pr
用模型进行拟合得如下结果:
第二问模型
(1)多元线性分析
对影响国内旅游收入的五个因素之间的关系分析国内旅游人数x1(百万人次)、城镇居民人均旅游支出x2(元)、农村居民人均旅游支出x3(元)、公路里程x4(万公里)、铁路里程x5(万公里)关系分析
图三、各个因素的相关系数图
由上图可知,各个因素之间具有高度的相关性,如果直接用所有数据去建立回归模型的话,易产生因素之间的共线性。因此,我们决定用采用逐步回归的方法建立回归模型。利用SPSS软件得如下结果:
图四、模型一的参数检验
由上面图的过程可知,我们最终得到的模型为模型3,再对模型进行F检验结果如下:
由上可知模型的拟合优度R=0.998,调整的拟合优度R=0.996,模型的拟合优度较好,且F检验(p
再对残差进行检验得P-P 图
图五、残差的正态性检验图
由P-P图知,模型的残差服从正态分布。进一步验证模型可用。 因此,最终模型一为:
y=−3255.321+10.835x1+5.99x3−20.060x4
(2)时间序列分析
由模型知,影响国内旅游收入的主要因素为旅游人数、农村旅游消费以及公路里程。因为所给数据为时间序列数据,所以我们又在模型的基础上考虑时间对各个因素之间的影响。因此,我们又利用SAS软件对各个因素进行时间序列分。以国内旅游收入为例: (1)建立时序图:
图六、国内旅游收入的时序图
根据时序图可以看出,2004-2014年国内旅游收入数据具有明显的上升趋
势,数据为非平稳序列,于是对数据进行一阶差分,得一阶差分时序图如下:
图七、国内旅游收入一阶差分时序图
根据时序图可以看出,2004-2014年国内旅游收入一阶差分仍具有明显的上升趋势,数据为非平稳序列,于是对数据进行二阶差分,得二阶差分时序图如下:
图八、国内旅游收入二阶差分时序图
从二阶差分时序图可以看出,国内旅游收入二阶差分的时序图已经没有 明显的上升趋势,呈平稳分布。因此对数据进行单位根检验如图:
图九、国内旅游收入二阶差分的单位根检验
由单位根检验可知,
Rho统计量、
Tau统计量和F统计量的概率值Pr都小于0.01,因此可以得出国内旅游收入二阶差分具有平稳性。对国内旅游收入进行纯随机性检验如下:
通过白噪声检验,6阶的Chi-square统计量的概率值Pr>0.01,因此不能拒绝原假设,但造成这种情况的原因是因为样本数据量太少,因此我们通过时序图判断国内旅游收入不具有随机性,可以对其建立ARIMA模型。 利用SAS软得到序列的自相关图和偏自相关图如下:
图十、国内旅游收入的自相关图
图十一、国内旅游收入的偏自相关图
由自相关图和偏自相关图可知,国内旅游收入的偏自相关系数在延迟一阶之后迅速衰减到两倍标准误之内,因此可以建立AR(1)模型。
综上可知国内旅游收入与一阶国内旅游收入具有高度的相关性,当年国内旅游收入受到上年国内旅游收入的影响。
对其它因素用一样的方法分析得:
图十二、国内旅游人数的自相关图
图十三、国内旅游人数的偏自相关图
国内旅游人数与一阶国内旅游人数具有高度的相关性,当年国内旅游人数受到上年国内旅游人数的影响。
图十四、农村旅游消费的自相关图
图十五、农村旅游消费的偏自相关图
由自相关图和偏自相关图可知,农村旅游消费的自相关系数和偏自相关系数在一阶及之后都在两倍标准误之内,因此不可以建立AR(p)模型。 综上可知农村旅游消费与一阶农村旅游消费不具有高度的相关性,当年农村旅游消费不受到上年农村旅游消费的影响。
图十六、公路里程的自相关图
图十七、公路里程的偏自相关图
公路里程与一阶公路里程具有高度的相关性,当年公路里程受到上年公路里程的影响。
(3)模型建立
由以上的分析可知,国内旅游收入、一阶国内旅游收入与国内旅游人数 、一阶国内旅游人数、公路里程 、一阶公路里程以及农村旅游之间有高度的相关关系,因此可以建立美国内旅游收入、一阶国内旅游收入与国内旅游人数 、一阶国内旅游人数、公路里程 、一阶公路里程以及农村旅游的线性模型。
为了建立线性模型,首先对数据进行正态性检验(P-P图)。文章的开始,我们已经检验过,数据符合正态性。
利用Eviews软件,建立模型如下:
模型的F检验:
统计量F-statistic=1303.110,Prob(F-statistic)=0.0000
R-squared=0.9984685且调整后的Adjusted R-squared=0。997701,说明模型具有很高拟合优度,所建模型为很好的线性模型; 序列相关性检验:
Durbin-Watson=1.749331,说明模型不具有序列相关性; 参数检验:
通过参数检验可知,参数x1t−1、参数x2t−1以及参数x3t(Pr>0.05)不显著外,其余参数(Pr
因此,去掉参数x1t−1、参数x2t−1以及参数x3t再进行建模。 去掉参数x1t−1,进行建模得如下模型、模型检验及参数估计:
模型的
F检验:
统计量F-statistic=1508.69,Prob(F-statistic)=0.0000
拟合优度:
R-squared=0.99828且调整后的Adjusted R-squared=0.997618,说明模型具有很高拟合优度,所建模型为很好的线性模型;
序列相关性检验:
Durbin-Watson=1.648502,说明模型不具有序列相关性; 参数检验:
通过参数检验可知,参数x2t−1和参数x3t(Pr>0.05)不显著外,其余参数(Pr
去掉参数x2t−1,进行建模得如下模型、模型检验及参数估计:
模型的F检验:
统计量F-statistic=1614.360,Prob(F-statistic)=0.0000
拟合优度:
R-squared=0.997837且调整后的Adjusted R-squared=0.997219,说明模型具有很高拟合优度,所建模型为很好的线性模型;
序列相关性检验:
Durbin-Watson=1.795097,说明模型不具有序列相关性; 参数检验:
通过参数检验可知,所有参数(Pr
yt=−2910.027+0.302837yt−1+7.566093x1t−14.08207x2t+7.395051x3t
六、模型评价
模型的优点
1) 具有很好的创新性,在对传统模型的理解的基础上,取模型之长,考虑时间
因素对其他变量的影响,对未来5年内国内旅游收入进行了较为准确的预测; 2) 解决问题的思路宽阔,所建立的模型,可以在不同时期,结合当前具体情况,
对问题进行求解,使该模型具有很好的推广性和通用性;
3) 该模型中所涉及的数据均来自“中国统计局”官方数据,并且对论文中涉及
到的众多影响因素进行了量化处理,使得论文的说服力强; 4) 采用采用逐步回归法建模,得到的模型较为全面、简洁、直观。
模型的缺点
1) 影响国内旅游收入的因素很多,而且不可能都能涉及到,所以模型与实际还
是有一些差距的;
2) 基于模型的假设,数据选取的有限性,因此预测的结果存在一定的误差.
参考文献
[1] 阮晓青,周义仓,数学建模引论,北京:高等教育出版社,2010
[2] 盛骤,谢式千,潘承毅,中国旅游收入研究,北京,高等教育出版社,2010 [3] 高祥宝,董寒青.数据分析与SPSS应用.北京:清华大学出版社,2007.6 [4] 徐全智,杨晋浩,数学建模,北京:高等教育,2008
[5] 司守奎,孙玺菁,关于旅游收入的计量经济学研究,北京:国防工业出版社,2013.2
[6] 梁冯珍,宋占杰,张玉环.中国入境旅游市场回归预测模型,天津:天津大学出版社,2004
[7] 曾小鱼,郑娟,曾文军,全国旅游收入预测分析[J],高等函授学报,2008 [8] 李永胜,旅游收入预测中的模型选择与参数认定[J],财经科学,2004
附件
SAS部分程序代码
以国内旅游人数为例: data a; input lysr;
time=intnx('year','01jan1978'd,_n_); difx=dif(dif(lysr)); format time year.; cards; 1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9 ; run;
proc gplot data=a;
plot gdp*time=1 difx*time=2; run;
proc arima data=a;
identify var=difx stationarity=(adf=2) minic p=(0:5) q=(0:5); estimate p=1; run;