第5章 关于中国人口预测问题的模型(2007A )
5.1 中国人口增长预测
中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。根据已有数据,
运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。
近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等,这些都影响着中国人口的增长。2007年年初发布的《国家人口发展战略研究报告》(附录1)还做出了进一步的分析。
关于中国人口问题也有多方面的研究,并积累了大量数据资料。附录2就是从《中国人口统计年鉴》上收集到的部分数据。
试从中国的实际情况和人口增长的上述特点出发,参考附录2中的相关数据(也可以搜索相关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;特别要指出模型中的优点与不足之处。
附录1《国家人口发展战略研究报告》(略) 附录2人口数据(《中国人口统计年鉴》中的部分数据)及其说明(略)
5.2 问题分析与建模思路概述
人口预测是一个历史悠久的问题,同时也是一个非常现实、重要的问题,时至今日,人们依然可以在新闻媒体上看到人口发展的新特点,在各种学术刊物上读到最新的研究成果。所以选择本问题的参赛队,首先面临的一个问题是:如找到创新的突破点?
各种数学建模教材上已有的人口模型,通常考虑的是人口基数,性别结构,年龄结构,出生死亡等因素对人口增加的影响,这些因素都可以作为后续研究的基础,只是还要考虑本问题中提到的一些新情况,包括老龄化、出生人口性别比的现实情况和未来预期,乡村人口城镇化带来的冲击等。2007年《国家人口发展战略研究报告》中还提到了其他新情况,设法科学地区分轻重,将这些新情况反映在模型中,就是参赛对的创新点。
可以用来做长期预测的数学方法种类比较多,不过大致可以分为确定性和不确定性两大类。确定性方法不外乎随时间或空间演变的微分方程、差分方程;不确定性方法则可以考虑马尔可夫链等随机过程方法,或者将相关因素的影响模糊化,建立模糊微分、差分方程模型。当然,完全基于数据建模也是可行的,比如统计回归、时间序列、灰色预测、神经网络等,不过完全基于数据的建模方法来做长期的预测不太合适,如果多种建模方法结合使用,效果会好一些。
具体建模时,首先需要对数据做一些分析。应该注意到城镇和农村在生育率和新生人口性别比方面有较大差异,因此建模时有必要区别对待;不同
年龄段的死亡率也有明显差异,0~3岁婴幼儿死亡率较高,50岁以上人口死亡率不断升高,夹在中间年龄的人口死亡率较小而且变化不大;《中国人口统计年鉴》中的统计方式与《国家人口发展战略研究报告》略有差异,需要对数据进行加工;如果发现异常数据,需要进行有理有据的进行修正、增删。 建立常微分方程(组)模型是比较常规的思路,主要是如何将本问题中提到的中国人口新特征体现在模型中。不过即使是常规思路,也有很多创新的空间。比如预测2040年的人口增长时,2000——2020年左右新生人口的数量、性别比将发挥主要作用,这种情况反映在模型中,需要考虑所谓的“时滞”现象,而考虑时滞现象的微分、差分方程理论研究已经积累了大量成果,完全可以应用在模型中。即使短时间内没有信心掌握相关的理论,也完全可以直接求数值解,对问题做出解答。
最后,长期以来,许多国内外学者都曾经做过中国人口预测,中国政府也会在一定时间发布人口统计结果和预测,参赛队得到的结果肯定会与这些不同来源的研究、预测存在差异,是否能够正确认识这些差异,并给出合理解释,也是参赛队能力的体现。
5.3 参赛论文——关于中国人口预测问题的模型
作者:赵鹏飞 伍斌 高志丰 指导老师:李学文
获奖情况:2007年全国数学建模竞赛 摘要
本文针对我国的人口特点,引入控制理论中的Z-传递矩阵(即LESLIA 矩阵) 来模拟系统的反馈控制作用,根据以上特点对人口增长率的影响建立一个闭环控制模型。首先,我们根据所给数据建立了三个反映上述特点的子模型,对于城镇化过程,我们利用logistic 曲线建立了一个城镇化模型用以预测城镇化水平,对于出生婴儿的性别差异,我们假设我国进入中等发达国家后,基本不会再有婴儿性别选则,即婴儿性别比恢复自然值,并拟和了婴儿性别比发展规律;最后为了预测老龄化的过程,我们中将人口分为若干段,各段人口构成了一个向量,这个向量在LESLIE 控制矩阵的传递作用下发生变动并最终达到向量成员间的比例平衡,并由此可以得到反映人口结构的老龄化系数,社会抚养比及适龄劳动人口比,最后为了提高LESLIE 控制调节的灵敏度,我们进一步对模型进行了改进,即揉和进上述特点以后,LESLIE 矩阵成为一个可以随时间可以自动改变的智能
矩阵,这样预测出的结果更加准确,人口系统最终能达到平衡。
最后对模型的优缺点进行评价,指出了人口预测模型中的不足,并提出了更合理预测中国人口增长的建议。
关键词:反馈控制 逻辑斯蒂曲线 中国人口增长 生育率 男女性别比
5.3.1 问题的重述
中国是世界上人口最多的发展中国家. 在科学技术和生产力飞速发展的同时,人口问题始终是制约我国发展的关键因素之一. 因此,中国政府坚持不懈地在全国范围推行计划生育基本国策,鼓励晚婚晚育. 经过30年的艰苦努力,中国在经济还不发达的情况下,有效地控制了人口过快增长,有力地促进了中国综合国力的提高、社会的进步和人民生活的改善.
近年来,中国的人口发展出现了一些新的特点影响着中国人口的增长. 例如,人口老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等,2007年初发布的《国家人口发展战略研究报告》(附录1)做出了进一布的分析. 附录2是从《中国人口统计年鉴》上收集到的关于中国人口问题的部分数据. 关于中国人口问题已有多方面的研究, 由于其已严重制约了中国经济的发展, 所以对中国人口做出分析和预测始终是一个重要问题. 下面考虑两个问题:
(1)利用附录2中有关数据(也可以搜索相关文献和补充新的数据), 从中国的实际情况和人口增长的上述特点出发,建立中国人口增长的数学模型; (2)利用所求模型对中国人口增长的中短期和长期趋势做出预测,并指出模型中的优缺点.
5.3.2 问题的分析
我们首先对现有数据进行拟合。从拟和得到的图形发现我国城镇化的过程与物种生长曲线极其类似,这可以了解为物种生长过程与城镇化同样大致经历三个过程,即缓慢增长期,快速增长期,饱和期,我们可以利用logistic 曲线来模拟。在拟和出生婴儿性别差异时,我们按照实际情况假设1950年以前婴儿性别比为自比指标比例。并且假设我国进入中等发达国家后,基本不会再有婴儿性别选则。即婴儿性别比恢复自然值。并使用了这些数据拟和了符合实际情况的婴儿性别比规律。为了反映老龄化的影响,我们中将人口分为若干段,各段人口构成一个向量,这个向量在LESLIE 控制矩阵的作用下发生变动并最终达到向量成员间的比例平衡。
然后考虑到我国人口增长的特点,即老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等,这些因素通过影响出生率和死亡率中而最终影响人口的增长。考虑到海外人口所占比例很小,根据自动控制的原理,我们可以根据以上因素对人口增长率的影响建立一个闭环控制模型,假设我国人口系统是 一个能控制且稳定系统,即从长期来看我国人口各项指标将达到稳定,并引入控制理论中的Z-传递矩阵(即LESLIA 矩阵) 来模拟系统的反馈控制作用。 5.3.3 模型假设及符号规定
1.模型的假设
(1)为方便计算,记2001年为第1年; (2)表中数据客观真实,具有可靠性;
(3)各个年龄的城市乡镇人口比,性别比均与整体的相应比例一致; (4)假设中国人口是一个封闭的系统,没有人口的迁入与迁出; (5)假设在没有政策性变化时(如限制生育年龄,或允许多育),育龄妇女的生育率关于年龄的相对分布是稳定的;
(6)假设在未来的很长一段时间内,医学上没有大的革命,死亡率的变化将很小,我们认为其不变. 2 .符号规定
x i (0) :初始时刻第i 个年龄组的女性的人数;
x i (t ) :第i 个年龄组的女性在时刻t 的人数,
x (t ) =[x 0(t ), x 1(t ), , x m (t )]T , t =0,1, 2, ;
λ i :第i 年不同类型人的生育率的权值;
b i (t ) :第i 年龄组中平均每人每年生育并生存下来的人数; d i (t ) :在时间t 时年龄为i 的人的死亡率;
s i (t ) :第i 年龄组中到t +1时生存下来并进入i +1年龄组的人的比例
(i =0, 1, 2, ) ;
a j (k ) :第j 年的第k 种类型的妇女人口(k =1, 2, 3分别代表城市、镇、农村
的妇女) 。
5.3.4 模型的建立与求解 1.城镇化模型
对于乡村人口城镇化问题,我们通过城镇人口占总人口的比率预测城镇人口比率,从而得到城镇化的规律。对于城镇人口比例趋势,我们使用曲线来拟合预测。
假设城镇人口的比例为P (t ) ,P (t ) 为关于时间t 的函数,根据logistic 模型,有城镇人口比率增长的速度与P (t )(1-
P (t )
) 成比例。这里的,K 为城镇人口K
能够达到的比例上限。当P (t ) 很小时,P (t ) 差不多近似等于1,所以城镇人口比例的增长速度与P (t ) 成比例的连续增长,但是,当P (t ) 大于0. 5K 时,1-
P (t )
小K
于0. 5,城镇人口比例增长速度逐渐减慢。根据以上的假定,城镇人口比例增长的速度为
dP (t ) P (t )
=rP (t )(1-)(r 为比例常数) dt K K
解微分方程得:P (t ) =(m 为常数) 。
1+me -rt
利用已知数据用Origin 软件拟合函数,得到K =0. 71175,m =1. 01625,
r =0. 10623 χ2分布检验值为0. 00007,中国城市人口可以达到的比例上限为:K =0. 71175,与其他机构预测的值接近并符合真实情况。因此我们认为我们拟
合的函数很好的反应了真实情况。则有
P (t ) =
0. 71175
1+1. 01625e -0. 10623t
表5-1 城市人口比例预测值
2. 出生婴儿性别比例预测模型
自然条件下出生的婴儿性别比为107:100,将这个婴儿出生比例作为正常
值。假设在1950年以前,由于技术等原因,无法选择婴儿性别,那时的婴儿出生性别比为自然比例,即107:100。到2050年,我国进入中等发达国家,人的素质会有很大提高,同时法律也将更加健全。这时几乎可以排除婴儿性别选择,认为性别比例重新回到自然比例。我们将假设的1900——1950年的婴儿性别比例和2050——2100年的性别比例与题目所给的1994——2005年的婴儿性别比作为已知值,拟合婴儿性别比例变化曲线,得到婴儿比例的规律,预测未来的婴儿性别比。
由于婴儿比例函数两端都有极限,中间取极大值 ,所以我们选择符合规律
(x -x c )的函数: Y=y+Aexp[
2
2w
2
]
分别按照城市、镇和乡村来拟合,其中城市婴儿男女比例比与年份的拟合曲
线如图5-1所示。
其中,y 0=107,xc =2004,w=23.52,A=7.52。
X2值为1.2798;R 2值为0.86081。表5-2是2006——2020年的城市婴儿性
图5-1 城市婴儿性别比拟合曲线
别比预测值(更多预测数据略)。
表 5-2 城市婴儿性别比预测值
同理,图5-2比拟合曲线其中,
为镇婴儿性别
图。
y 0=107,xc =2003,w=23.52,A=19.9。
X 2值为12.24383;R 2值为0.76017。表5-3是2006——2020年的城镇婴儿性别比预测值(更多预测数据参见附录),其中,y 0=107,xc =2003,w=23.52,A=19.9.
图5-2 镇婴儿性别比拟合曲线
表 5-3 城镇婴儿性别比预测值
图5-3为乡村婴儿性别比拟合曲线图。
图5-3 乡村婴儿性别比拟合曲线
其中,y 0=107,xc =2003,w=23.52,A=19.9。
X2值为12.24383;R 2值为0.76017。表5-4是2006——2020年的城镇婴儿性别比预测值(更多预测数据参见附录)。
3.女性人口与总人口的关系模型
我们以第五次人口普查(2000年)的男女比例106:100为基准值,女性人口与总人口的关系为
106+100C t =
100
通过对男女婴儿性别比x t (t为时间) 加权反馈调节,预测人口,我们以人均寿命的一半为影响半径,人均寿命简化计算为70岁。定义权值P t 为在影响半径内出生的婴儿性别比高出正常值的差值,即
P t = i =t -35
因此,得到总人口应为
C t =
∑
t
x i -10735
P t +106+100
100
4. 基于人口结构的单性模型
模型主要考虑女性人口数,鉴于男女人口数有一定的比值(可以预测出来),则由女性人口可以得知总人口数,将女性按年龄顺序分为若干组,假设每一组的
妇女有相同的生育率和死亡率,并且假设最大寿命为90岁(90岁以上按90岁计算)。
以年为区间,其中15-49岁年龄段的女性有生育能力。
令x i (t)表示第I 个年龄组的女性在时刻t 的人数,x i (0)表示初始时刻第i 个年龄组中女性的人数,设为已知的。下面建立模型来描述x(t)=(x0(t),x1(t),…,x m (t))T 在t=0,1,2,…时候的性态。
第0年龄组在时间t+1的人数为t~t+1这1年内出生并存活的人数,即 x 0(t +1) =∑b i x i (t ) (1)
i =0m
设在t+1时年龄组1~m的人数均正比于前一年龄组在时间t 的人数,即对i=1,2,3,4,…
x i (t +1) =s i -1x i -1(t ) (2) 其中,s i 表示第i 个年龄组中至t+1时存活下来并进入i+1年龄组的人的比例。用矩阵G(t)记号,人口增长模型可以表示为
x (t +1) =G (t ) x (t ), t =0,1, 2, (3) 其中
⎛0 s 0(t ) 0 0
G (t ) = 0
0 0 : 0⎝
... 0b i (t ) ... b h (t ) ... 00... 0... 00... 0... s i -1(t ) 0... 0... 0s i (t ) ... 0... 00... 0... :0
0:0
0:0
0⎫⎪0⎪0⎪⎪0⎪0⎪⎪ 0⎪⎪
... s h (t ) ... 00⎪::::⎪
⎪
000s m -1(t ) 0⎪⎭
...
... ... ... ... ... 000000
此模型可以用递推的方式预测个年龄组的人数,进而对人口总量及其年龄结构进行预测,由于人群中只有15~49岁的妇女有生育能力,而最大寿命为90岁,则矩阵中i =15, h =49,m =89,显然有
x (t ) =G (t ) G (t -1)... G (0) x (0) (4) 下面就需要确定动态矩阵的表达式,即确定向量
b =(t ) =(0, . 0. b i (. t ) , , b . h (. t ) . , , 0. ) . . ,
s =(t ) =(0,..., 0, s i (t ),..., s h (t ),..., 0) 。
(1)b(1)的确定
我们把某个时间的妇女的生育年龄分布同时看作一个妇女一生中生育孩子数的分布,
于是某个时点的综合生育率等于一个妇女一生中生育的孩子数。统计观察城市和农村妇女人口的生育的年龄结构,我们发现两者有很大的不同(这里仅拿2004年作为参考)。
通过Excel 软件统计计算出历年的城市乡镇的女性人口比例,进而确定不同人类的生育率的权值λk ,其中我们认为λk =
a k
3
,从而可加权平均统计出2004
k
∑a
k =1
年的城镇、乡村育龄妇女的生育率,如图5-4所示。
图5-4 2004年的城镇、乡村育龄妇女的身育率
其中横坐标中的值0表示年龄为15岁的女孩,以此类推各值均加上15表示相应的年龄段的妇女生育率(下同)。
从图中可发现:乡村妇女的综合生育率明显高于城镇妇女,同时他们的生育高峰也比城市妇女早一些,且计划生育政策及执行情况也有很大的不同,所以本文中将把这两种情况分开讨论,则式(1)可化为
x 0(t +1) =x (t +1) +x (t +1) =∑b (t ) x (t ) +∑b i n (t ) x i n (t ) (5)
cz
n 0
cz i
cz i
i =0
i =0
m
m
用同样的方法,可以分别得到2001-2005年城镇、乡村妇女的年龄分布如图5-5和图5-6所示。
从图5-2~5-3中我们知道,在不同的时间城镇妇女的育龄年龄分布曲线惊人的类似,乡村妇女亦然。
图5-5 2001-2005年的城镇育龄妇女的生育率
图5-6 2001-2005年的乡村育龄妇女的生育率
利用Orign 软件中的Lognormal 函数,分别对城镇妇女育龄年龄分布曲线与乡村育龄年龄分布曲线进行回归分析,得到回归方程b i (t ) 的关于t 的函数,即
b i (t ) =Py i cz (t ) +(1-P ) y i n (t ) 其中
i 2⎡⎤-(ln) ⎢⎥. 9t -30831
y i cz (t ) =-0. 145t +292+215exp ⎢2⎥(0. 0077t -15. 3) i
2(0. 077t -15. 3) ⎢⎥ ⎣⎦
i 2⎤⎡-(ln) ⎥⎢cz y i (t ) =-0. 594t +1194+2π(0. 009t -17.9) i exp ⎢2⎥2(0. 009t -1。9) ⎢⎥ ⎣⎦
0. 71175
P = -0. 10623t
1+1. 01625e
将各年龄值代入即可求得b (t ) 。 (2)s (t ) 的确定
易知s i (t ) =1-d i (t ) ,则可以通过求得d (t ) 间接求得s (t ) 。
同上面b (t ) 一样,我们先作图观察2001-2005年的个年龄段妇女的死亡率,从而利用Orign 软件进行回归分析。即得到d i (t ) =0. 02e
2001-t
+0. 29e
-i 9. 97
,则有
s i (t ) =1-d i (t ) =0. 02e
2001-t
+0. 29e
-i 9. 97
综合(1)(2)可以求得矩阵G (t ) 关于t 的函数,即
⎡0⎢
⎢0.679⎢0⎢⎢⎢0
G (T ) =⎢
⎢0⎢⎢0⎢0⎢⎢ ⎢⎣0
1-0.02e
000
t -2001
Py l cz (t ) +(1-P ) y l n (t )
00
-0.29e
-l +19.97
1-0.02e
t -2001
000 0
cz n Py h (t ) +(1-P ) y h (t )
00000
-0.29e
-l 9.97
00 0
0000000
t -2001
→
←
1-0.02e
t -2001
-0.29e
-h 9.97
1-0.02e
-0.29e
-m +19.97
0⎤ ⎥0⎥0⎥⎥0⎥0⎥⎥0⎥⎥0⎥⎥ ⎥⎥0⎥⎦
代入(4)式,由于数据庞大,在这我们只利用MATLAMB 软件求解取5个年为一个年龄段进行计算,结果如图5-5所示。
表5-5 中国人口总数与女性人口比列预测
从预测表中可以看出,近期来看人口仍然会继续增长,而女性人口比却保持长期稳定。从长期来看,人口将在2060年前后达到峰值,而后将稳定向来保持在一定水平(约15亿人口)。
5.3.5 模型的评价
模型的优点:
(1)本模型很好的体现了中国人口的特点,考虑到了城市化,出生性别比,人口老龄化对人口增长的特点。而且从预测女性人口入手,使求解很大的简化,并使各种影响因素更好的结合。
(2)准确利用了题中提供的数据,并且对数据进行了较透彻的分析,抓住了分析的要点,踢除了一些不符合实际情况且对问题影响不大的数据,较好的完成了数据的提取与应用。
(3)在预测人口增长的中短期和长期趋势时,我们综合考虑了中国人口发展的一些新特点,分别建立了人口老龄化程度模型,出生人口性别比模型以及乡村人口城镇化趋势模型,利用这三个模型,我们对这些因素在未来一段时间里的趋势做出了预测。
(4)在本文中, 我们分别采用了logistic 模型,莱斯利(Leslie )矩阵法两种方法对中国人口的中短期和长期增长趋势进行了预测, 并对比分析了各自的预测结果. 这样有利于提高预测的准确度。 (5)利用莱斯利矩阵建立的模型可以得到详尽的逐年的人口年龄分布. 为社会其它领域(如教育, 商业等)的发展规划提供必要的人口信息. 用它做短期的人口预测是十分理想的. 同时,这一模型的应用十分灵活,通过调整模型的参量,
可以定量的分析许多因素对人口的影响,也可以通过观察人口结构的 变化分析其它社会因素影响的大小。 模型的缺点:性别比例影响准确度不够,在预测其他影响因素时亦使用了一些简化考虑,使模型预测精度有所降低。 模型的改进:可以在搜集更多数据或考虑更多的自然,社会因素方面更准确的预测出生率,死亡率,城市化,老龄化,性别比例。并且可以在控制矩阵精度
方面进行改进,使得控制矩阵更为准确。通过这两方面的改进,得到结果会更和理,更准确。
5.3.6 参考文献
[1] 宋兆基等,MATLAB 在科学计算中的应用,北京:清华大学出版社,2005. [2] 谭永基等,数学模型,上海:复旦大学出版社,1996.
[3] 钦软科技,Excel2003在统计学中的应用,北京:电子工业出版社,2005. [4] 李训经等,控制理论基础,北京:高等教育出版社,2002.
5.4 论文点评
人口预测是一个老问题,资料充足,相关的研究成果也非常多,仅各种数学建模教材中就介绍了多种人口模型。这些虽然为参赛队提供了很多方便,但也要求参赛队必须要找到好的创新点和思路,否则很容易被淹没在各种各样已有的模型中,体现不出自身的实力和特色。
本文获得了全国一等奖,应该说是从海量研究成果中脱颖而出,表现出了较强的创新能力。本文作者首先对数据进行了简单的拟合,认为与描述有限资源下单种群增长的Logistic 模型比较接近,因此采用Logistic 曲线对人口增长作出预测,在预测老龄化过程时,作者定义了不同年龄层的人数向量,并引入了可随时间变化的LESLIE 矩阵来模拟系统的反馈控制作用。这些都表现出了作者对各种数学方法掌握很好,能够灵活运用。本文在设计模型上想的一个亮点是将人口总数的预测,比较大胆而且有其合理性。
总体上说,本文的主要特点是将题中提到的各种因素都一一建立模型,予以考虑。尽管在考虑部分因素时,采用的数学结构非常简单,但都提供了比较完整的逻辑关系,在参赛论文中是比较出色的。不足之处是部分环节处理稍显粗糙。
比如考虑城镇化对人口增长的影响是,作者认为主要是城镇化带来的城乡人口比例的变化,对城镇化的影响处理比较粗略。有点参赛队提到,城镇化一方面是影响了城乡人口比例,另一方面,城镇化带来的生活环境、工作环境的变化也对人们的生育观念产生很大的影响。这些情况都可以酌情在模型中予以体现。另外,文中直接采用了Logistic 模型对城镇人口比例做拟合和预测,这也是可以继续细化的一个环节,比如参照国家的一些长远规划,逐年给出预测数据。
考虑婴儿性别比例的影响时,由于数据难以查找,作者假设1900-1950年的婴儿性别比例为自然状态的107:100,这个假设本身是需要论证的。实际上,与其这样直接假设,不如通过一些方法,比如根据这些年份的人口性别比例等因素倒推出来当时的婴儿性别比例。另外,也可以考虑借用文化背景类似的国家或地区的数据。
本文作者主要是基于数据建模,没有做详细的人口增长影响因子分析。如果能在这些方面多做一些考虑,也就是说,在数据建模中加入更多的机理分析,则模型将更具说服力。比如说,国内外每年都会有大量的有关人口的研究报告、论文公开发布,经过长时间的积累,对影响人口增长的相关因素已经有了非常成熟的分析和认识。实际上只有正确的查找资料,掌握权威的相关研究成果,参赛队完全可以有理有据地给出考虑主要影响因素的人口预测模型。这样给出的模型,将比单纯根据数据建立的模型要更具合理性。
在论文撰写方面,摘要部分非常简洁,紧紧围绕自己使用的方法和得到的结论,是一个非常好的范本,值得后来的参赛队借鉴。论文整体上行文简洁,看起来思路清晰、目的明确,不过缺点是一些细节不够规范,需要解释的地方也一带而过。比如图表的规范做法是出了有编号、标题之外,最好在标题部位对图标的主题、要点做一些简单的说明。与此同时,文中对图表的解释和说明也过于简单。无论国内还是国外,图表都是最受欢迎的表达形式,如果使用得当,可以让读者在最短的时间内理解作者的意图,不过前提是必须有足够的说明和解释。本文前半部分给出的图片很难让人在第一时间看明白,所以有必要给予适当是说明。比如文中认为所得的拟合曲线是合理的,但图片却显示数据与拟合曲线有一定的差别,应该如何理解,等等。
第5章 关于中国人口预测问题的模型(2007A )
5.1 中国人口增长预测
中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。根据已有数据,
运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。
近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等,这些都影响着中国人口的增长。2007年年初发布的《国家人口发展战略研究报告》(附录1)还做出了进一步的分析。
关于中国人口问题也有多方面的研究,并积累了大量数据资料。附录2就是从《中国人口统计年鉴》上收集到的部分数据。
试从中国的实际情况和人口增长的上述特点出发,参考附录2中的相关数据(也可以搜索相关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;特别要指出模型中的优点与不足之处。
附录1《国家人口发展战略研究报告》(略) 附录2人口数据(《中国人口统计年鉴》中的部分数据)及其说明(略)
5.2 问题分析与建模思路概述
人口预测是一个历史悠久的问题,同时也是一个非常现实、重要的问题,时至今日,人们依然可以在新闻媒体上看到人口发展的新特点,在各种学术刊物上读到最新的研究成果。所以选择本问题的参赛队,首先面临的一个问题是:如找到创新的突破点?
各种数学建模教材上已有的人口模型,通常考虑的是人口基数,性别结构,年龄结构,出生死亡等因素对人口增加的影响,这些因素都可以作为后续研究的基础,只是还要考虑本问题中提到的一些新情况,包括老龄化、出生人口性别比的现实情况和未来预期,乡村人口城镇化带来的冲击等。2007年《国家人口发展战略研究报告》中还提到了其他新情况,设法科学地区分轻重,将这些新情况反映在模型中,就是参赛对的创新点。
可以用来做长期预测的数学方法种类比较多,不过大致可以分为确定性和不确定性两大类。确定性方法不外乎随时间或空间演变的微分方程、差分方程;不确定性方法则可以考虑马尔可夫链等随机过程方法,或者将相关因素的影响模糊化,建立模糊微分、差分方程模型。当然,完全基于数据建模也是可行的,比如统计回归、时间序列、灰色预测、神经网络等,不过完全基于数据的建模方法来做长期的预测不太合适,如果多种建模方法结合使用,效果会好一些。
具体建模时,首先需要对数据做一些分析。应该注意到城镇和农村在生育率和新生人口性别比方面有较大差异,因此建模时有必要区别对待;不同
年龄段的死亡率也有明显差异,0~3岁婴幼儿死亡率较高,50岁以上人口死亡率不断升高,夹在中间年龄的人口死亡率较小而且变化不大;《中国人口统计年鉴》中的统计方式与《国家人口发展战略研究报告》略有差异,需要对数据进行加工;如果发现异常数据,需要进行有理有据的进行修正、增删。 建立常微分方程(组)模型是比较常规的思路,主要是如何将本问题中提到的中国人口新特征体现在模型中。不过即使是常规思路,也有很多创新的空间。比如预测2040年的人口增长时,2000——2020年左右新生人口的数量、性别比将发挥主要作用,这种情况反映在模型中,需要考虑所谓的“时滞”现象,而考虑时滞现象的微分、差分方程理论研究已经积累了大量成果,完全可以应用在模型中。即使短时间内没有信心掌握相关的理论,也完全可以直接求数值解,对问题做出解答。
最后,长期以来,许多国内外学者都曾经做过中国人口预测,中国政府也会在一定时间发布人口统计结果和预测,参赛队得到的结果肯定会与这些不同来源的研究、预测存在差异,是否能够正确认识这些差异,并给出合理解释,也是参赛队能力的体现。
5.3 参赛论文——关于中国人口预测问题的模型
作者:赵鹏飞 伍斌 高志丰 指导老师:李学文
获奖情况:2007年全国数学建模竞赛 摘要
本文针对我国的人口特点,引入控制理论中的Z-传递矩阵(即LESLIA 矩阵) 来模拟系统的反馈控制作用,根据以上特点对人口增长率的影响建立一个闭环控制模型。首先,我们根据所给数据建立了三个反映上述特点的子模型,对于城镇化过程,我们利用logistic 曲线建立了一个城镇化模型用以预测城镇化水平,对于出生婴儿的性别差异,我们假设我国进入中等发达国家后,基本不会再有婴儿性别选则,即婴儿性别比恢复自然值,并拟和了婴儿性别比发展规律;最后为了预测老龄化的过程,我们中将人口分为若干段,各段人口构成了一个向量,这个向量在LESLIE 控制矩阵的传递作用下发生变动并最终达到向量成员间的比例平衡,并由此可以得到反映人口结构的老龄化系数,社会抚养比及适龄劳动人口比,最后为了提高LESLIE 控制调节的灵敏度,我们进一步对模型进行了改进,即揉和进上述特点以后,LESLIE 矩阵成为一个可以随时间可以自动改变的智能
矩阵,这样预测出的结果更加准确,人口系统最终能达到平衡。
最后对模型的优缺点进行评价,指出了人口预测模型中的不足,并提出了更合理预测中国人口增长的建议。
关键词:反馈控制 逻辑斯蒂曲线 中国人口增长 生育率 男女性别比
5.3.1 问题的重述
中国是世界上人口最多的发展中国家. 在科学技术和生产力飞速发展的同时,人口问题始终是制约我国发展的关键因素之一. 因此,中国政府坚持不懈地在全国范围推行计划生育基本国策,鼓励晚婚晚育. 经过30年的艰苦努力,中国在经济还不发达的情况下,有效地控制了人口过快增长,有力地促进了中国综合国力的提高、社会的进步和人民生活的改善.
近年来,中国的人口发展出现了一些新的特点影响着中国人口的增长. 例如,人口老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等,2007年初发布的《国家人口发展战略研究报告》(附录1)做出了进一布的分析. 附录2是从《中国人口统计年鉴》上收集到的关于中国人口问题的部分数据. 关于中国人口问题已有多方面的研究, 由于其已严重制约了中国经济的发展, 所以对中国人口做出分析和预测始终是一个重要问题. 下面考虑两个问题:
(1)利用附录2中有关数据(也可以搜索相关文献和补充新的数据), 从中国的实际情况和人口增长的上述特点出发,建立中国人口增长的数学模型; (2)利用所求模型对中国人口增长的中短期和长期趋势做出预测,并指出模型中的优缺点.
5.3.2 问题的分析
我们首先对现有数据进行拟合。从拟和得到的图形发现我国城镇化的过程与物种生长曲线极其类似,这可以了解为物种生长过程与城镇化同样大致经历三个过程,即缓慢增长期,快速增长期,饱和期,我们可以利用logistic 曲线来模拟。在拟和出生婴儿性别差异时,我们按照实际情况假设1950年以前婴儿性别比为自比指标比例。并且假设我国进入中等发达国家后,基本不会再有婴儿性别选则。即婴儿性别比恢复自然值。并使用了这些数据拟和了符合实际情况的婴儿性别比规律。为了反映老龄化的影响,我们中将人口分为若干段,各段人口构成一个向量,这个向量在LESLIE 控制矩阵的作用下发生变动并最终达到向量成员间的比例平衡。
然后考虑到我国人口增长的特点,即老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等,这些因素通过影响出生率和死亡率中而最终影响人口的增长。考虑到海外人口所占比例很小,根据自动控制的原理,我们可以根据以上因素对人口增长率的影响建立一个闭环控制模型,假设我国人口系统是 一个能控制且稳定系统,即从长期来看我国人口各项指标将达到稳定,并引入控制理论中的Z-传递矩阵(即LESLIA 矩阵) 来模拟系统的反馈控制作用。 5.3.3 模型假设及符号规定
1.模型的假设
(1)为方便计算,记2001年为第1年; (2)表中数据客观真实,具有可靠性;
(3)各个年龄的城市乡镇人口比,性别比均与整体的相应比例一致; (4)假设中国人口是一个封闭的系统,没有人口的迁入与迁出; (5)假设在没有政策性变化时(如限制生育年龄,或允许多育),育龄妇女的生育率关于年龄的相对分布是稳定的;
(6)假设在未来的很长一段时间内,医学上没有大的革命,死亡率的变化将很小,我们认为其不变. 2 .符号规定
x i (0) :初始时刻第i 个年龄组的女性的人数;
x i (t ) :第i 个年龄组的女性在时刻t 的人数,
x (t ) =[x 0(t ), x 1(t ), , x m (t )]T , t =0,1, 2, ;
λ i :第i 年不同类型人的生育率的权值;
b i (t ) :第i 年龄组中平均每人每年生育并生存下来的人数; d i (t ) :在时间t 时年龄为i 的人的死亡率;
s i (t ) :第i 年龄组中到t +1时生存下来并进入i +1年龄组的人的比例
(i =0, 1, 2, ) ;
a j (k ) :第j 年的第k 种类型的妇女人口(k =1, 2, 3分别代表城市、镇、农村
的妇女) 。
5.3.4 模型的建立与求解 1.城镇化模型
对于乡村人口城镇化问题,我们通过城镇人口占总人口的比率预测城镇人口比率,从而得到城镇化的规律。对于城镇人口比例趋势,我们使用曲线来拟合预测。
假设城镇人口的比例为P (t ) ,P (t ) 为关于时间t 的函数,根据logistic 模型,有城镇人口比率增长的速度与P (t )(1-
P (t )
) 成比例。这里的,K 为城镇人口K
能够达到的比例上限。当P (t ) 很小时,P (t ) 差不多近似等于1,所以城镇人口比例的增长速度与P (t ) 成比例的连续增长,但是,当P (t ) 大于0. 5K 时,1-
P (t )
小K
于0. 5,城镇人口比例增长速度逐渐减慢。根据以上的假定,城镇人口比例增长的速度为
dP (t ) P (t )
=rP (t )(1-)(r 为比例常数) dt K K
解微分方程得:P (t ) =(m 为常数) 。
1+me -rt
利用已知数据用Origin 软件拟合函数,得到K =0. 71175,m =1. 01625,
r =0. 10623 χ2分布检验值为0. 00007,中国城市人口可以达到的比例上限为:K =0. 71175,与其他机构预测的值接近并符合真实情况。因此我们认为我们拟
合的函数很好的反应了真实情况。则有
P (t ) =
0. 71175
1+1. 01625e -0. 10623t
表5-1 城市人口比例预测值
2. 出生婴儿性别比例预测模型
自然条件下出生的婴儿性别比为107:100,将这个婴儿出生比例作为正常
值。假设在1950年以前,由于技术等原因,无法选择婴儿性别,那时的婴儿出生性别比为自然比例,即107:100。到2050年,我国进入中等发达国家,人的素质会有很大提高,同时法律也将更加健全。这时几乎可以排除婴儿性别选择,认为性别比例重新回到自然比例。我们将假设的1900——1950年的婴儿性别比例和2050——2100年的性别比例与题目所给的1994——2005年的婴儿性别比作为已知值,拟合婴儿性别比例变化曲线,得到婴儿比例的规律,预测未来的婴儿性别比。
由于婴儿比例函数两端都有极限,中间取极大值 ,所以我们选择符合规律
(x -x c )的函数: Y=y+Aexp[
2
2w
2
]
分别按照城市、镇和乡村来拟合,其中城市婴儿男女比例比与年份的拟合曲
线如图5-1所示。
其中,y 0=107,xc =2004,w=23.52,A=7.52。
X2值为1.2798;R 2值为0.86081。表5-2是2006——2020年的城市婴儿性
图5-1 城市婴儿性别比拟合曲线
别比预测值(更多预测数据略)。
表 5-2 城市婴儿性别比预测值
同理,图5-2比拟合曲线其中,
为镇婴儿性别
图。
y 0=107,xc =2003,w=23.52,A=19.9。
X 2值为12.24383;R 2值为0.76017。表5-3是2006——2020年的城镇婴儿性别比预测值(更多预测数据参见附录),其中,y 0=107,xc =2003,w=23.52,A=19.9.
图5-2 镇婴儿性别比拟合曲线
表 5-3 城镇婴儿性别比预测值
图5-3为乡村婴儿性别比拟合曲线图。
图5-3 乡村婴儿性别比拟合曲线
其中,y 0=107,xc =2003,w=23.52,A=19.9。
X2值为12.24383;R 2值为0.76017。表5-4是2006——2020年的城镇婴儿性别比预测值(更多预测数据参见附录)。
3.女性人口与总人口的关系模型
我们以第五次人口普查(2000年)的男女比例106:100为基准值,女性人口与总人口的关系为
106+100C t =
100
通过对男女婴儿性别比x t (t为时间) 加权反馈调节,预测人口,我们以人均寿命的一半为影响半径,人均寿命简化计算为70岁。定义权值P t 为在影响半径内出生的婴儿性别比高出正常值的差值,即
P t = i =t -35
因此,得到总人口应为
C t =
∑
t
x i -10735
P t +106+100
100
4. 基于人口结构的单性模型
模型主要考虑女性人口数,鉴于男女人口数有一定的比值(可以预测出来),则由女性人口可以得知总人口数,将女性按年龄顺序分为若干组,假设每一组的
妇女有相同的生育率和死亡率,并且假设最大寿命为90岁(90岁以上按90岁计算)。
以年为区间,其中15-49岁年龄段的女性有生育能力。
令x i (t)表示第I 个年龄组的女性在时刻t 的人数,x i (0)表示初始时刻第i 个年龄组中女性的人数,设为已知的。下面建立模型来描述x(t)=(x0(t),x1(t),…,x m (t))T 在t=0,1,2,…时候的性态。
第0年龄组在时间t+1的人数为t~t+1这1年内出生并存活的人数,即 x 0(t +1) =∑b i x i (t ) (1)
i =0m
设在t+1时年龄组1~m的人数均正比于前一年龄组在时间t 的人数,即对i=1,2,3,4,…
x i (t +1) =s i -1x i -1(t ) (2) 其中,s i 表示第i 个年龄组中至t+1时存活下来并进入i+1年龄组的人的比例。用矩阵G(t)记号,人口增长模型可以表示为
x (t +1) =G (t ) x (t ), t =0,1, 2, (3) 其中
⎛0 s 0(t ) 0 0
G (t ) = 0
0 0 : 0⎝
... 0b i (t ) ... b h (t ) ... 00... 0... 00... 0... s i -1(t ) 0... 0... 0s i (t ) ... 0... 00... 0... :0
0:0
0:0
0⎫⎪0⎪0⎪⎪0⎪0⎪⎪ 0⎪⎪
... s h (t ) ... 00⎪::::⎪
⎪
000s m -1(t ) 0⎪⎭
...
... ... ... ... ... 000000
此模型可以用递推的方式预测个年龄组的人数,进而对人口总量及其年龄结构进行预测,由于人群中只有15~49岁的妇女有生育能力,而最大寿命为90岁,则矩阵中i =15, h =49,m =89,显然有
x (t ) =G (t ) G (t -1)... G (0) x (0) (4) 下面就需要确定动态矩阵的表达式,即确定向量
b =(t ) =(0, . 0. b i (. t ) , , b . h (. t ) . , , 0. ) . . ,
s =(t ) =(0,..., 0, s i (t ),..., s h (t ),..., 0) 。
(1)b(1)的确定
我们把某个时间的妇女的生育年龄分布同时看作一个妇女一生中生育孩子数的分布,
于是某个时点的综合生育率等于一个妇女一生中生育的孩子数。统计观察城市和农村妇女人口的生育的年龄结构,我们发现两者有很大的不同(这里仅拿2004年作为参考)。
通过Excel 软件统计计算出历年的城市乡镇的女性人口比例,进而确定不同人类的生育率的权值λk ,其中我们认为λk =
a k
3
,从而可加权平均统计出2004
k
∑a
k =1
年的城镇、乡村育龄妇女的生育率,如图5-4所示。
图5-4 2004年的城镇、乡村育龄妇女的身育率
其中横坐标中的值0表示年龄为15岁的女孩,以此类推各值均加上15表示相应的年龄段的妇女生育率(下同)。
从图中可发现:乡村妇女的综合生育率明显高于城镇妇女,同时他们的生育高峰也比城市妇女早一些,且计划生育政策及执行情况也有很大的不同,所以本文中将把这两种情况分开讨论,则式(1)可化为
x 0(t +1) =x (t +1) +x (t +1) =∑b (t ) x (t ) +∑b i n (t ) x i n (t ) (5)
cz
n 0
cz i
cz i
i =0
i =0
m
m
用同样的方法,可以分别得到2001-2005年城镇、乡村妇女的年龄分布如图5-5和图5-6所示。
从图5-2~5-3中我们知道,在不同的时间城镇妇女的育龄年龄分布曲线惊人的类似,乡村妇女亦然。
图5-5 2001-2005年的城镇育龄妇女的生育率
图5-6 2001-2005年的乡村育龄妇女的生育率
利用Orign 软件中的Lognormal 函数,分别对城镇妇女育龄年龄分布曲线与乡村育龄年龄分布曲线进行回归分析,得到回归方程b i (t ) 的关于t 的函数,即
b i (t ) =Py i cz (t ) +(1-P ) y i n (t ) 其中
i 2⎡⎤-(ln) ⎢⎥. 9t -30831
y i cz (t ) =-0. 145t +292+215exp ⎢2⎥(0. 0077t -15. 3) i
2(0. 077t -15. 3) ⎢⎥ ⎣⎦
i 2⎤⎡-(ln) ⎥⎢cz y i (t ) =-0. 594t +1194+2π(0. 009t -17.9) i exp ⎢2⎥2(0. 009t -1。9) ⎢⎥ ⎣⎦
0. 71175
P = -0. 10623t
1+1. 01625e
将各年龄值代入即可求得b (t ) 。 (2)s (t ) 的确定
易知s i (t ) =1-d i (t ) ,则可以通过求得d (t ) 间接求得s (t ) 。
同上面b (t ) 一样,我们先作图观察2001-2005年的个年龄段妇女的死亡率,从而利用Orign 软件进行回归分析。即得到d i (t ) =0. 02e
2001-t
+0. 29e
-i 9. 97
,则有
s i (t ) =1-d i (t ) =0. 02e
2001-t
+0. 29e
-i 9. 97
综合(1)(2)可以求得矩阵G (t ) 关于t 的函数,即
⎡0⎢
⎢0.679⎢0⎢⎢⎢0
G (T ) =⎢
⎢0⎢⎢0⎢0⎢⎢ ⎢⎣0
1-0.02e
000
t -2001
Py l cz (t ) +(1-P ) y l n (t )
00
-0.29e
-l +19.97
1-0.02e
t -2001
000 0
cz n Py h (t ) +(1-P ) y h (t )
00000
-0.29e
-l 9.97
00 0
0000000
t -2001
→
←
1-0.02e
t -2001
-0.29e
-h 9.97
1-0.02e
-0.29e
-m +19.97
0⎤ ⎥0⎥0⎥⎥0⎥0⎥⎥0⎥⎥0⎥⎥ ⎥⎥0⎥⎦
代入(4)式,由于数据庞大,在这我们只利用MATLAMB 软件求解取5个年为一个年龄段进行计算,结果如图5-5所示。
表5-5 中国人口总数与女性人口比列预测
从预测表中可以看出,近期来看人口仍然会继续增长,而女性人口比却保持长期稳定。从长期来看,人口将在2060年前后达到峰值,而后将稳定向来保持在一定水平(约15亿人口)。
5.3.5 模型的评价
模型的优点:
(1)本模型很好的体现了中国人口的特点,考虑到了城市化,出生性别比,人口老龄化对人口增长的特点。而且从预测女性人口入手,使求解很大的简化,并使各种影响因素更好的结合。
(2)准确利用了题中提供的数据,并且对数据进行了较透彻的分析,抓住了分析的要点,踢除了一些不符合实际情况且对问题影响不大的数据,较好的完成了数据的提取与应用。
(3)在预测人口增长的中短期和长期趋势时,我们综合考虑了中国人口发展的一些新特点,分别建立了人口老龄化程度模型,出生人口性别比模型以及乡村人口城镇化趋势模型,利用这三个模型,我们对这些因素在未来一段时间里的趋势做出了预测。
(4)在本文中, 我们分别采用了logistic 模型,莱斯利(Leslie )矩阵法两种方法对中国人口的中短期和长期增长趋势进行了预测, 并对比分析了各自的预测结果. 这样有利于提高预测的准确度。 (5)利用莱斯利矩阵建立的模型可以得到详尽的逐年的人口年龄分布. 为社会其它领域(如教育, 商业等)的发展规划提供必要的人口信息. 用它做短期的人口预测是十分理想的. 同时,这一模型的应用十分灵活,通过调整模型的参量,
可以定量的分析许多因素对人口的影响,也可以通过观察人口结构的 变化分析其它社会因素影响的大小。 模型的缺点:性别比例影响准确度不够,在预测其他影响因素时亦使用了一些简化考虑,使模型预测精度有所降低。 模型的改进:可以在搜集更多数据或考虑更多的自然,社会因素方面更准确的预测出生率,死亡率,城市化,老龄化,性别比例。并且可以在控制矩阵精度
方面进行改进,使得控制矩阵更为准确。通过这两方面的改进,得到结果会更和理,更准确。
5.3.6 参考文献
[1] 宋兆基等,MATLAB 在科学计算中的应用,北京:清华大学出版社,2005. [2] 谭永基等,数学模型,上海:复旦大学出版社,1996.
[3] 钦软科技,Excel2003在统计学中的应用,北京:电子工业出版社,2005. [4] 李训经等,控制理论基础,北京:高等教育出版社,2002.
5.4 论文点评
人口预测是一个老问题,资料充足,相关的研究成果也非常多,仅各种数学建模教材中就介绍了多种人口模型。这些虽然为参赛队提供了很多方便,但也要求参赛队必须要找到好的创新点和思路,否则很容易被淹没在各种各样已有的模型中,体现不出自身的实力和特色。
本文获得了全国一等奖,应该说是从海量研究成果中脱颖而出,表现出了较强的创新能力。本文作者首先对数据进行了简单的拟合,认为与描述有限资源下单种群增长的Logistic 模型比较接近,因此采用Logistic 曲线对人口增长作出预测,在预测老龄化过程时,作者定义了不同年龄层的人数向量,并引入了可随时间变化的LESLIE 矩阵来模拟系统的反馈控制作用。这些都表现出了作者对各种数学方法掌握很好,能够灵活运用。本文在设计模型上想的一个亮点是将人口总数的预测,比较大胆而且有其合理性。
总体上说,本文的主要特点是将题中提到的各种因素都一一建立模型,予以考虑。尽管在考虑部分因素时,采用的数学结构非常简单,但都提供了比较完整的逻辑关系,在参赛论文中是比较出色的。不足之处是部分环节处理稍显粗糙。
比如考虑城镇化对人口增长的影响是,作者认为主要是城镇化带来的城乡人口比例的变化,对城镇化的影响处理比较粗略。有点参赛队提到,城镇化一方面是影响了城乡人口比例,另一方面,城镇化带来的生活环境、工作环境的变化也对人们的生育观念产生很大的影响。这些情况都可以酌情在模型中予以体现。另外,文中直接采用了Logistic 模型对城镇人口比例做拟合和预测,这也是可以继续细化的一个环节,比如参照国家的一些长远规划,逐年给出预测数据。
考虑婴儿性别比例的影响时,由于数据难以查找,作者假设1900-1950年的婴儿性别比例为自然状态的107:100,这个假设本身是需要论证的。实际上,与其这样直接假设,不如通过一些方法,比如根据这些年份的人口性别比例等因素倒推出来当时的婴儿性别比例。另外,也可以考虑借用文化背景类似的国家或地区的数据。
本文作者主要是基于数据建模,没有做详细的人口增长影响因子分析。如果能在这些方面多做一些考虑,也就是说,在数据建模中加入更多的机理分析,则模型将更具说服力。比如说,国内外每年都会有大量的有关人口的研究报告、论文公开发布,经过长时间的积累,对影响人口增长的相关因素已经有了非常成熟的分析和认识。实际上只有正确的查找资料,掌握权威的相关研究成果,参赛队完全可以有理有据地给出考虑主要影响因素的人口预测模型。这样给出的模型,将比单纯根据数据建立的模型要更具合理性。
在论文撰写方面,摘要部分非常简洁,紧紧围绕自己使用的方法和得到的结论,是一个非常好的范本,值得后来的参赛队借鉴。论文整体上行文简洁,看起来思路清晰、目的明确,不过缺点是一些细节不够规范,需要解释的地方也一带而过。比如图表的规范做法是出了有编号、标题之外,最好在标题部位对图标的主题、要点做一些简单的说明。与此同时,文中对图表的解释和说明也过于简单。无论国内还是国外,图表都是最受欢迎的表达形式,如果使用得当,可以让读者在最短的时间内理解作者的意图,不过前提是必须有足够的说明和解释。本文前半部分给出的图片很难让人在第一时间看明白,所以有必要给予适当是说明。比如文中认为所得的拟合曲线是合理的,但图片却显示数据与拟合曲线有一定的差别,应该如何理解,等等。