2023年12月20日发(作者:虹桥模拟数学试卷)
基于双线性系统、差分方程的人口增长模型
摘 要
社会经济的许多领域的规划都必须考虑人口这一重要因素。而人口普查只能为我们提供某几个时间点的横截面数值,但在现实生活中,人们常常需要其他时间点的人口总数及其构成。于是一个迫切的任务就是如何用少数的几个时点的信息比较准确的得到较详尽的其他时点的人口数据。
人口系统发展是一个动力学过程,为强惯性系统,人口死亡率和出生率构成人口增长的双线性系统。
针对中短期预测,基于统计理论,将5年的死亡出生率,死亡率求期望,建立了人口增长的定常差分方程模型,预测至2015的人口发展趋势,通过MATLAB求解得到2015年的总人口为14.17亿,乡村城镇化趋势明显;并且人口在2025左右出现峰值,约为15.1亿。
针对长期预测,根据动力学发展过程理论,当时间尺度接近惯性系统的时间常数(社会人口的平均寿命)时,人口状态将发生明显改变。由此建立了人口增长的时变差分模型。并通过MATLAB求解,预测2050年的人口总数为14.33亿,人口系统达稳定状态。
然后,利用Leslie矩阵分析模型的稳定性。当时间t(年)充分大时人口增长也趋于稳定。针对长期模型的检验,对不同的总和生育率做出了人口总数的变化曲线。得出当总和生育率的更替水平临界值略大于2.0。
关键词:差分方程,强惯性系统,Leslie矩阵,总和生育率
1
一.问题重述与分析
1.1问题重述
中国乃泱泱人口大国,人口规模是城市规划和土地利用总体规划中一项重要的控制性指标,人口规模是否合理,不仅影响到未来地区经济和社会发展,而且会影响到地区生态环境可持续发展。 因此准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和现实意义。
根据国家人口报告,对短期、中期和长期人口预测作如下定义:十年内为短期,十到十五年为中期,五十年及其以上为长期。
人口发展过程是一个很缓慢的过程。它的“时间常数”接近平均期望寿命约七、八十年的时间。人口状态随时间变化的过程称为人口发展过程。
目前,中国人口发展出现了新的特点,突出表现为老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些因素都影响着中国人口的增长。
要能有利于人口与经济的社会的协调发展,必须将人口总量峰值控制15亿人左右,全国总和生育率在未来30年应保持在1.8左右。同时,近年的低生育水平反弹势能大,维持生育水平代价高,这就必须创新工作思路、机制和方法。在确定人口发展战略时,必须着眼于人口本身的问题,处理好人口与经济资源环境之间的相互关系。构建和谐社会,又要优先投资人的全面发展。
1.2问题分析
本题是一个人口发展预测的问题。人口发展与一般种群增长一样,是由自然增长率决定的。然而,人类个体是一种社会的个体,所以人口发展有自己的特点。想到人口的迁移,性别比例等。人口发展受政策的影响,例如计划生育;也要受到人们意识的影响,像生育意识等。但是从社会层面上看,生育意识在整个社会上体现为妇女的生育模式。
首先,数据的处理。在经过分析和验证后,适当修正题中的个别有误数据后,利用有效数据进行建模求解。我们要提取出死亡率、生育率等,这是求解人口增长模型的必要数据。
其次,模型建立。和一般的预测模型一样,本模型也是个预测模型,所以考虑到用前一年的信息来推得下一年,于是我们想到差分方程模型。同时,将死亡率与出生率分开,分别与当年的人口相乘,于是得到一个双线性的模型,即死亡与出生都与当年的人口成线性关系。
最后,利用已有信息,对中短期与长期进行预测,得出反映人口发展与人口构成的关键指数。
2
二.符号系统
符号
N(t)
意 义 单位
万人
万人
万人
万人
万人
岁
_
_
_
_
_
t年度总人口数
t年度i岁的人口总数
xi(t)
wi(t)
mi(t)
t年度i岁的女性人数
t年度i岁的男性人数
t年度i岁的妇女平均每人一年生育的子女数
t年度人口的平均年龄
t年度i岁的年龄死亡率
fi(t)
A(t)
i(t)
s(t)
t年度男女性别比
t年度i岁的女性比例
t年度人口相对出生率
t年度自然增长率
ki(t)
b(t)
r(t)
三.模型假设
1) 中国的市、镇、乡三个系统的整体封闭,不考虑国际上人口流动;
2) 十年内为短期,十到十五年为中期,五十年及其以上为长期;
3) 婴儿出生年份过了年底12月即为一岁;
4) 90岁及其以上年龄的人在模型建立和求解中,都按90岁考虑;
四.模型分析与建立
4.1 模型分析
为了对我国中长期和长期人口进行预测,必须考虑我国人口的实际特征,传统的指数模型,logistic模型都不能够得到令人满意的结果,因而必须建立适合中国人口增长的数学模型,宋健模型对于预测中国的人口增长具有借鉴作用。
在建立人口增长模型时,首先不考虑国际人口流动,即假设中国为一封闭的大系统,但由于我国人口地区分布的特征不能简单的用一个笼统的模型进行概括,所以可以假设市,镇,乡为独立的系统,通过对每个系统的人口增长建立预
3
测模型,最后通过求和得到全国的人口增长预测模型。
考虑到市,镇,乡每个系统均可用改进的宋健模型进行预测,因而我们首先建立对所有子系统都使用的人口增长预测模型:
4.1.1封闭人口系统的离散模型
1)死亡人口
用t表示时间,并且以年度为单位。用xi(t)表示t年度(比如2001年)满i周岁但不到i1周岁的人口总数,i1,2,m,m是人能活到的最高年龄,题中,m取为90+。t年度各年龄的人口总数t叫做人口年龄构成,记为向量形式x(t){x0(t),x1(t),,xm(t)},叫做人口状态向量。
t年度满i周岁的人口数xi(t),经过一年后变成了xi1(t),其中有一部分人由于各种原因而死亡,死亡人口数为xi(t)xi1(t1)。据此定义年龄死亡率函数i(t)
i(t)得:
xi(t)xi1(t1),i1,2,xi(t)m …… (1)
xi(t1)[1i(t)]xi(t),i1,2,m …… (2)
2)下面再讨论生育人口
首先定义女性比例函数ki(t),它是t年度i岁的妇女人数wi(t)与i岁总人口数xi(t)之比,即
ki(t)wi(t)xi(t) …… (3)
式中,t年度满i岁总人口数为xi(t),则年满i岁的妇女人数为ki(t)xi(t)。妇女育龄区间记为a1,a2,a1和a2分别为有生育能力的妇女的最小和最大年龄,题中a115,a249。
用年龄别生育率fi(t)表示t年度年龄为i周岁的妇女平均每人在一年内所生子女数。再用Fi(t)表示t年度年龄为i岁的妇女组在一年内所生育子女总数,则有
Fi(t)fi(t)ki(t)xi(t)fi(t)i(t) …… (4)
4
新生人口,即所有育龄妇女在t年度一年内所生育子女总数(t)为
(t)iaFiiafi(t)ki(t)xi(t) ……. (5)
11a2a2令fi(t)(t)hi(t),ia1,a11, 并且hi(t)满足下述条件
a2, …… (6)
…… (7)
将(6)式两边从a1到a2对i求和,则有
ia1a2hi(t)1a2ia1fi(t)(t) …… (8)
其中(t)就是妇女总和生育率,为每名妇女按照某一年的各年龄组生育率度过育龄期,平均可能生育的子女数,是衡量生育水平最常用的指标之一。
将(8)代入(5)中,便得到
(t)(t)iahi(t)ki(t)xi(t) …… (9)
1a2由式(9)可以得出,t年出生的人口数(t)与该年总和生育率(t)成正比。
满足条件(7)的hi(t),ia1,a11,,a2,称为妇女生育模式。它反映了不同年龄上育龄妇女的生育水平。hi(t)的大小说明i周岁年龄上生育水平的高低,用统计学语言,即不同生育年龄上的加权因子。在式(9)中
ia1hi(t)ki(t)xi(t)ia1hii(t) …… (10)
就是t年度生育了孩子的妇女加权平均数。(t)同样与妇女平均数成正比。
将(2)、(9)联立起来,就得到一个封闭的人口发展离散方程组。
a2a2)ia1hit(ki)tx(it),(
)
(t)t(a2x0(t)
x1(t1)(10)x0(t)
x2(t1)(11)x1(t) …… (11)
xm(t1)(1m1(t))xm1(t)
引入向量和矩阵符号,
5
x1(t)x2(t)人口状态向量
x(t),
xm(t)01(t)人口状态转移矩阵
H(t)2(t),
m1(t)m(t)0ba1(t)ba2(t)生育矩阵
B(t)
其中bi(t)(10(t))ki(t)hi(t),ia1,a11,,a2。
则上述离散方程组(11)可表述为下述向量形式,即为封闭系统的人口增长模型:
x(t1)H(t)x(t)(t)B(t)x(t)
x(t0)x0 …… (12)
4.1.2开放人口系统的离散模型
式(12)描述的是封闭人口发展过程,如果考虑人口迁入、迁出和人口城镇化的趋势。引入人口迁移向量g(t):
g0(t)g1(t)g(t) …… (13)
gm1(t)其中gi(t),i1,2,m1,是t年度年满i岁的人口迁移数量,迁入为正,迁出为负。g(t)是带有统计性质的随机变量。
将式(13)加入式(12)得到完整的人口增长模型:
x(t1)H(t)x(t)(t)B(t)x(t)g(t)
x(t0)x0 …… (14)
上述方程为完整的人口发展离散方程。右端第一项反映了死亡因素对人口发展的影响;第二项反映了生育因素对人口发展的影响;第三项反映了迁移对人口发展的影响。
方程右边反映t年度人口年龄构成演变到t1年度。方程左边则是t1年度人口年龄构成。因此,方程组(14)全面反映了出生、死亡、迁移和时间这四个影响人口发展的基本因素。
上式(14)中,妇女总和生育率(t)是控制量,通过控制、调节(t)来改变
6
和控制人口的发展趋势。状态向量是年龄构成x(t)。从控制论的观点来看,式(14)是一个双线性系统。
针对市、镇和乡三个系统而言,均为开放人口系统,但把市、镇和乡作为一
整体,则为封闭的人口系统。即有,g(t)0。
4.2 人口增长预测模型的建立
针对市、镇和乡三个系统,用x(1)(t),x(2)(t),x(3)(t)分别表示t年度市、镇和乡的总人口。
最终基本模型为
N(t)i1x(i)(t)
3x(i)(t1)H(i)(t)x(i)(t)(i)(t)B(i)(t)x(i)(t)g(i)(t)
x(i)(t)w(i)(t)m(i)(t),i1,2,3 …… (15)
五.模型进一步分析与求解
5.1数据分析
通过对附录2中的数据进行分析,以及与中华人民共和国国家统计局()上的数据进行对比,发现附表2中2001-2004年的城市男、城市女、镇男、镇女、乡男、乡女的数据应为1‰抽样调查数据;2005年的应为1.31%。另外,2003年的城市妇女生育率、镇妇女生育率、乡村妇女生育率比起其他年份少了一个数量级。所以,在模型建立求解中,对上数数据进行修正。
另外,在尝试对2001-2005年死亡率、生育率等做拟合时,发现1-3次的拟合都不理想,四次以上已经没有意义。下面给出2001-2005年20岁城市男性的死亡率的散点图(图1):
7
2001-2005年的城市男性死亡率散点图32.52死亡率1.510.5320042005年份/年图1 2001-2005年的城市男性死亡率散点图
图中散点拟合的符合度太低,根据统计理论,采用期望作为一个计算的标准。
5.2 中短期人口预测
短期模型直接由上面基本模型式(15)计算,下面进行简化分析与实现
5.2.1中短期人口预测模型简化
根据国家相关政策,定制人口预测十年内为短期,十到十五年为中期。这里取5年为一个时间段,2005年为初始点,预测短期2010年,中期2015,2020年的人口结构。
先观察市、镇、乡三元结构的发展趋势,每个子系统占总体系的比例rs1,rs2,rs3利用Matlab 拟合工具箱,2001到2005年数据拟合,随时间呈线性关系(如图2),
城市人口比例 城市乡村人口比例 乡村镇人口比例 镇
0.60.5比例0.40.30.20.1
11.522.533.544.55年份/年图2市镇乡人口比例
8
其中线型最粗(最上一条)为乡村人口比例曲线,f(x)-0.01782x+0.6472
中间一条为城市人口比例曲线,
f(x)0.006694x+
0. 下面一条为乡村人口比例曲线,
f(x)0.01113x+
0首先模型假设中国为一个大的封闭系统,其中的三个子系统市,镇,乡之间相互依存,分别记为S1, S2, S3(如下图3所示)
乡村S3城市S1镇S2图3
这里绕开了迁移率求解,对于市、镇、乡三元结构,巧妙地打断市、镇、乡三个子系统之间的联系。因为对于中短期预测,三个子系统独立发展按照模型4.1求解得到人口数与实际考虑迁移按照4.2求解得到的人口总量,经过误差分析,检验均符合较好。
表1 2001和2005年人口结构表
指标
总人口
城市
镇
乡
男性
女性
2001年人数/万人
122055.9
29537.2
15825.5
76693.2
65370
56686
2005年人数/万人
129662.4
35938.2
22205.95
71518.2
70309
59354
故,以2001年数据为初始条件,利用封闭系统模型4.1的式(12),与迭代求得2005年人口结构如下,并与表1中实际2005年数据对比。
表2 2005年数据对比
指标
总人口
市
镇
乡
男性
求得2005年人数/万人
131260.0
36380.0
22480.0
72400.0
66916.0
实际2005年人数/万人
129662.4
35938.2
22205.95
71518.2
65506.0
9
相对误差/%
1.23
1.21
1.23
1.22
1.24
女性
64344.0 64094.0 1.19
通过上表分析,得到 S1、S2、S3系统最终都符合的优化模型:
x(t1)H(t)x(t)(t)B(t)x(t)
x(t0)x0 …… (5.1.1)
再由数据分析中可知,死亡率、生育率可用作均值处理。进而简化模型为:
x(t1)Hx(t)(t)Bx(t)
x(t0)x0 ……. (5.1.2)
5.2.2 中短期人口预测模型求解
中短期定义为5~20年,取2005年数据作为初始值t02005,带入(5.1.2)差分方程,求得2010,2015年这两个关键时间点的横截面人口结构,如下表:
表3 2010年与2015年人口结构
指标
总人口
城市
镇
乡
0~14岁
15~64岁
65岁及其以上
显。
28%2010年人数/万 人
135510
41561
30395
63554
25044
102470
15052
2015年人数/万人
141730
48217
39670
53843
27548
102680
18523
1) 城镇化分析:乡村人口比例(饼图中分离的部分)逐年下降,乡村城镇化明乡城市31%乡城市55%47%34%38%城市乡镇17%镇镇22%28%
2005年比例 2010年比例 2015年比例
2)平均年龄:
表 4 平均年龄
年份
2005
2010
2015
10
平均年龄
35.0328
36.5485
37.5563
3)中短期(2005~2030年)预测总人口曲线图
1.55x 109短期人口预测1.51.451.4人口/人1.351.31.251.21.151.12年份/年.图4 短期人口预测
图中曲线峰值出现在2025年附近,峰值人口约为15.1亿。
5.3长期人口预测模型
由于一种人口政策的社会效果不能在数年内看出其全部表现。制定政策的人甚至不能期望在他们自己的寿命范围内看出该项政策的最终结局,只有后代才能根据实际效果来评价其正确与否。
因为市、镇、乡依据4.2中的基本模型:
x(t1)H(t)x(t)(t)B(t)x(t)g(t)
x(t0)x0
由于基本模型各项参数均是含时变量,对中短期预测影响不大,但在长期预测中,若忽略时间因素,时间上的误差积累,将导致预测的误差越来越大。比如
1.6x 109短期模型预测长期人口
1.551.5人口/人1.451.41.351.3
2050年度/年图5 短期模型预测长期人口
11
下面,用5.1中的短期模型来估计2020年以后的人口发展,如图5。
发现在2025年以后,过了一个峰值之后,人口总数持续上升,显然背离了实际情况。所以此模型对长期预测不再适用。
因此,长期预测要求找到参数随时间的变化规律。
首先,迁移向量g(t)随时间变化,但是考虑到人口迁移主要受到政策的控制和城市人口的容纳度的影响,所以:
g(t)g(t)1(t)
其中,而(t)是考虑迁移受多种因素影响,g1(t)是关于时间t的总体趋势函数,而产生的波动。
长期模型与短期的差别除了在迁移上,还表现在人口转移矩阵H(t)和生育矩阵B(t)。同样,考虑长期模型的影响因素复杂性,类似g(t),给出下面修正式:
用于计算H(t)的死亡率:(t)(t)2(t)
生育矩阵B(t)修正为:B(t)B(t)3(t)
于是有:x(t1)H(t)x(t)(t)B(t)x(t)g(t)1(t)
其中H(t)与B(t)为分别加入2(t)和3(t)后所得。
5.3.1长期人口预测求解
为了方便求解,将
(t)用t的简单函数进行处理,这里是用
(t)(t2005)0.001
进行计算。
1)根据模型假设,50年预测为长期,取2050年时间截断面,2050年人口结构如下表
表 5 2050年人口结构
指标
总人口
市
镇
乡
男子
女子
2050年人数/万人
143270
48081
53540
41663
73211
70059
12
0~14岁
15~64岁
65岁及以上
22796
89056
35767
2)由上表得,2050年,市、镇、乡比例如下图:
29%34%乡城市镇37%图 6 2050年市、镇、乡人口比例
3)平均年龄
A(t)1mixi(t)43.72,对比2005。2010。2015年的平均年龄,i0N(t)人口结构逐步趋向老龄化,最终达稳定状态。
六.模型评价与检验
6.1 模型稳定性分析
模型4.2中式(12)x(t1)H(t)x(t)(t)B(t)x(t),为双线性系统,其中人口状态转移矩阵H(t),人口状态向量x(t){x0(t),x1(t),,xm(t)}是m维向量,因此,系统的状态空间是m维的欧几里德空间向量Rm,它是由一切m维向量所组成的实线性空间。
可以写为x(t1)Hx(t)Bx(t)[HB]x(t),令L,即Leslie矩阵LHB,得x(t1)Lx(t)Lkx(0),k1,2, …… (15)
x(t)系统的稳定状态由Leslie矩阵决定。据文献[2]:
定理1
L矩阵有唯一的正特征根1,且它是单重的,1对应的正特征向量
x*[1,s1/1,s1s2/12,
13
,s1s2sn1/1n1]
L矩阵的其n1个特征根k都满足
k1,k2,3,n ……(16)
定理2 若L矩阵第一行有两项顺次元素都大于0,则式(16)中仅等号不成立,即
k1,k2,3,tn …… (17)
k且由式(15)表示的x(t)满足limx(t)1cx* …… (18)
从上述定理可以对时间充分大(t)后人口按年龄组的分布x(t)的性态做出如下分析:
1)由式(18),有
x(t) …… (19)
ckx*这表明当t充分大时,人口年龄的分布趋向稳定,其各年龄组的数量占总量的比例与特征向量x*中对应分量占总量的比例相同,即x*就表示了人口按年龄组的分布状况,故x*可称为稳定分布,它与初始分布x(t0)无关。
2)由式(19)又可以得到
xik()i,
xi(t1)1,n2
, 这说明当t充分大时人口增长也趋于稳定,其各年龄组的数量都是上一年度的倍,即人口增长完全由Leslie矩阵的唯一正特征根决定。显然,当1时,人口递增;1时,人口递减;;1时,人口总量不变。其中可称为固有增长率。
6.2 模型检验
6.2.1. 对短期模型中三系统处理方案的讨论:
针对5.1中市、镇、乡三个系统,做以下分析:
由于(一)三个系统之间可以一步到达,所以我们认为三个系统之间的人口只进行一次迁移(从始点至终点)。例如群体从乡迁移到镇再到市,迁移人口进行了两次迁移,但本模型将其当作从乡到市的一次转移。
(二)群体人口的出生率,死亡率,生育率在中短期时间范围内受环境的影响很小因而忽略不计,并认为迁移人口的出生率,死亡率,生育率仍与原所在系统保持一致,例如有群体P从乡迁移到市,但群体P的出生率,死亡率,生育率仍旧保持不变具有乡系统的属性(出生率,死亡率,生育率)。
(三)本问题中系统区别于系统的因素可以认为是出生率,死亡率,生育率;并把这些因素作为系统的属性。
由于,在10-15年之间转移的人口至多只能产生一代,因而可以考虑以下三种情况:
1) 假设所有的迁移人口在新系统中不产生下一代,即可以把他算作原所
14
在系统的人口,因而对于每个小系统而言,虽然有流动人口,但就整个大的封闭系统而言不受影响。
2) 假设所有的迁移人口在新系统中产生下一代.虽然在新系统中产生后代,但他的数量仍旧与其在原系统中所产生的后代相同,所以对整个大的封闭系统不产生影响。
3) 迁移的人口中一部分产生后代,一部分不产生后代。根据(1),(2)的分析知迁移人口对整个大系统不产生影响。
6.2.2.
长期预测模型中,对总和生育率的讨论
在长期预测模型中,针对不同的得到2005-2050的人口总数变化趋势。可见,在=2.0与=2.3之间,人口最终会趋于稳定,=2.5时2045年后的人口增长也比较缓慢。这与人口增长的特点是一致的。因为,一旦达到生育更替水平,出生和死亡将逐渐趋于均衡,在没有国际迁入与迁出的情况下,人口将最终停止增长,保持稳定状态。
2.2x 1092=3.01.8=2.5=2.3人口总数/人1.6=2.0=1.81.4=1.51.2=1.152年份/年2050
图 7 不同总和生育率下的人口增长趋势
6.3 模型优点
1.在4.2的模型建立中,死亡率和出生率(也就是相应的人口的自然增长率)作为此人口预测模型的基础,这是符合种群增长模型的特点的。同时,人口增长模型有自身的特点,比如迁入与迁出。于是,我们由封闭模型来得到了考虑迁入、迁出的开放模型。
与此同时,在本题中,根据模型假设将中国看作一个封闭系统,其中包含三
15
个开放的子系统。从而得到符合本题实际的差分模型。
所以,从模型建立过程来看,此模型符合从一般到特殊的过程。从模型考虑因素来看,包含了影响人口的重要因素。
2.在短期模型中,考虑到此模型具有短期的特点,所以部分参数变化对整体的影响较小。所以,做出合理的简化,方便了模型的求解。而由5.1中的定量检验得到2005年总人口误差为1.23%,市、镇、乡相应的人口误差分别为:1.21%,1.23%,1.22%。而男、女性人口误差为1.24%,1.19%。
3.在长期模型中,尽管最终发现人口总数趋于稳定,但是在人口发展过程中,由于多因素的影响,可能产生波动。于是,在模型中加入了扰动项。基于这点的考虑,使得模型更加充分。
4.此模型与Logistic模型相比,多考虑了人口结构的作用。比如,各年龄段的人口,性别比等等。
6.4 模型缺点
1.把整个中国看作一个封闭的系统,不考虑外国人口的迁入与本国人口的迁出。这在人口发展历史上是不可取,所以本模型作此假设,也就限定了此模型的应用范围。
2.在短期模型中,简化处理时,忽略了一些参数的变化,必定会损失一些精度。这里也可视为模型的不足之处。比如,将死亡率等取期望,将人口状态转移矩阵
H(t)转化为常矩阵H进行计算,这样必然导致存活人口与实际有差异。
七.参考文献
[1] 宋健 于景元,人口控制论,北京:科学出版社,1985.5
[2] 姜启源 谢金星 叶俊,数学建模(第三版),北京:高等教育出版社,2003.8
[3] 叶其孝 姜启源等译,数学建模(第3版),北京:机械工业出版社, 2005
[4] 陈杰,MATLAB宝典,北京:电子工业出版社,2007.1
[5] 王彦,八十年代以来我国人口发展的数学模型和展望,政学者论文集,2002
16
更多推荐
人口,模型,发展,系统,增长,生育
发布评论