题目: 黄冈市农村婚姻关系圈变化分析
【摘 要】
改革开放以来,农村婚姻圈的变化发生了显著的改变,本文从农村居民80后父母的婚配双方年龄,婚配家庭距离,居住地大小规模,居住地分布区域等因素作出分析。
本文采用统计分析对数据进行处理,并用excel 和matlab 对数据进行模拟绘图,并进行线性分析,得到以下结论:(1)本文采用最小二乘法对数据进行线性拟合,得到函数关系式
f (x ) =41.7309x +0.9243,并绘出折线图,编程进行
线性分析,R 2=1.000,P=0.00026
关键词:线性回归 拟合 回归分析 最小二乘法
一、 问题重述
随着城乡建设的步伐,越来越多的乡下人奔赴大城市找工作甚至安家落户,这就导致农村婚姻关系圈发生了变化。本文主要根据80年代初期统计了黄冈市内部分县级婚配关系数据,得到了影响80年代初期婚姻关系圈的一些影响因素,影响因素有自然村落、婚配双方之间的距离关系、婚配双方的年龄大小等。本文研究的问题主要是:
1. 婚配关系与自然村落的规模大小和地域的分布有关系? 2. 婚配关系与婚配双方居住地之间的距离的变化有关系? 3. 婚配关系与适婚年龄有关系?
二、 问题分析
本题主要是对黄冈婚姻关系圈的变化因素进行分析,对黄冈婚姻关系圈的发展趋势进行预测。
对于问题一,可以对已有的黄冈市附近部分县市的婚配关系的统计数据,对每一个地区的婚配关系单独进行分析处理,利用计算机作图,找出地域对婚配关系的影响情况。还可以将夫妇对数与自然村落规模大小做散点图,观察它们之间是否有关,还可以利用线性拟合的方式,找出这些离散点之间的函数关系式,就可以找出婚配关系与自然村落规模大小之间的关系。
对于问题二,通过提取整理夫妇对数与夫妇双方之间距离的分布的数据,采用分组的形式,利用matlab 编程绘制图像,观察图像的走向,看能否找到婚配关系与婚配双方居住地之间的距离的变化趋势。
对于问题三,统计了在不同年龄段夫妇婚配关系情况的数据,找出各年龄段夫妇对数的分布情况。
三、 模型的假设
1. 假设调查样本的选取是随机的。
2. 假设从1981年到1986年出生的孩子的父母的适婚年龄均在18—26岁之间。 3. 假设国家政策和地方人口迁移情况对本次调查的婚配关系没有影响。 4. 假设样本中的婚姻关系没有改变户籍状况。
四、符号说明
b :表示常数项和回归系数;
bint :表示常数项和回归系数对应的置信区间; r :表示残差;
rint :表示残差对应的置信区间;
stats :则分别对应拟合优度,F 值和P 值(统计量显著性概率);
五、模型的建立与求解
1、 问题一模型的建立与求解: 1.1、模型的建立:
对于问题一,要从两个方面的内容进行讨论:一个方面是通过对各个年龄段统计出来的出生地规模大小与夫妇对数分布情况进行统计分析,对出生地规模大小的影响进行一个综合评价;另一个方面是对各地区的婚姻关系分布情况做一个分析。
1.2、算法思想:
从给出的统计数据可以发现,很多的数据看起来杂乱无章,似乎没有什么规律可言,但是仔细分析后还是可以得到这样的结论:从全局上看,这些数据在整体上是上升的或者是下降的。所以在处理的过程中,可以采用线性最小二乘法进行拟合,利用matlab 进行编程,求解得到所要的函数关系式的相关系数,接下来用残差分析方法进行检验,判断这种拟合方式是否合理。 1.3、模型的求解:
1.3.1本文通过对黄冈市部分乡村婚配关系的距离调查数据,整理得到了80后父母的夫妇对数与其父亲所在地的规模大小的数据,具体数据如下表1:
作多项式f (x ) =a 1x +b 1,利用matlab 进行编程计算: x=[1 34 70 83 73 16]
y=[75 1393 3156 3084 3290 567] A=ployfit(x,y,1) Z=ployval(A,x)
plot(x,y,’k+’,x,Z, ’r ’)
xlabel(‘夫妇对数’) ;ylabel (‘出生地规模的大小’) 得到的相关系数为:
a 1=41.7309b 1=0.9243
Z=42.7 1419.8 2922.1 3464.6 3047.3 668.6
得到了夫妇对数与出生地规模大小之间的函数关系式为:
f (x ) =41.7309x +0.9243
得到的折线图如下图1:
图1 夫妇对数与出生地规模大小的关系
通过上图我们可以看出夫妇对数与出生地规模大小之间的关系是成正相关的。可以得到父亲出生地规模范围越大,夫妇对数也就越多。也说明了,现在人们的活动范围的扩大,人们选择配偶的范围也在扩大。
接下来,用线性回归的方法,来检验本文所得到的夫妇对数与出生地规模大小之间的函数关系式的拟合程度。 进行一元线性回归检验,建立模型
Y =b 0+b 1x 2+ε, ε
2
N (0, σ2)
其中,b 0,b 1,σ都是不依赖于x 的未知参数,b 1称为回归系数,编程如下: x=[1 1 1 1 1 1 ;1 34 70 83 73 16]'; y=[75 1393 3156 3084 3290 567]'; [b,bint,r,rint,stats]=regress(y,x) rcoplot(r,rint) 所得结果如下: b =
0.9243 41.7309 bint =
-528.6246 530.4732 32.2022 51.2596 r =
32.3448
-26.7743 233.9140 -380.5875 242.7213 -101.6184
rint =
-541.8539 606.5435 -774.8366 721.2881 -374.3614 842.1894 -587.7738 -173.4012 -341.0689 826.5116 -766.9432 563.7064
stats =
1.0e+004 *
0.0001 0.0148 0.0000 6.7641 得到如下残差分析图:
图2 残差图
我们此次做的数学线性回归均为简单的一元线性回归模拟:y=ax+b,采用matlab 进行区间估计和线性回归分析,在分析后所得数据中,b 表示常数项和回归系数,bint 表示常数项和回归系数对应的置信区间,r 表示残差,rint 表示残差对应的置信区间,stats 则分别对应拟合优度,F 值和P 值(统计量显著性概率),误差方差。
通过以上数据的检验,我们可以了解到:夫妇对数与出生地规模的大小,该回归方程的模拟程度较高,达至0.94,呈现分明的正相关,即女方更愿意嫁至男方所在地户口数更多的地方,而对于人烟稀少的地方则鲜有夫妇结婚居住,这也可以表明,80后青年更愿意生活在门庭若市的村镇而不愿意住在穷乡僻壤的山区,随着繁华村镇的不断发展,人口将进一步集中,而偏远地区则更加破落和荒芜。
1.3.2为了找出黄冈市部分乡村婚配关系与地域分布的关系,本文统计了不同地域的婚姻情况的分布如下表2所示:
本文又对表二当中的数据进行了处理,如下图3所示:
图3
通过上图很明显能够发现在随机统计的一组数据当中,其中黄梅、浠水和红安的夫妇对数最多,也说明了不同的地区的婚姻关系圈有所差异。即地区也是影响婚姻关系圈的变化的因素之一。
1.3.3通过对黄冈市部分乡村婚配关系的距离调查数据,我们统计了跨县结婚的数据如下表3所示:
表3 不同地区与婚姻关系的数据表
通过上表3的统计数据,显示出目前黄冈市跨县结婚的一个情况得到1984年以后出生的小孩的父母跨省结婚夫妇对数占整个调查婚姻关系圈人数的65.75%,那么就有理由相信现在的婚配关系圈会随着现代的发展越来越广,而且会被更多的人接受。
2、问题二的求解:
2.1 本文通过对黄冈市部分乡村婚配关系的距离调查数据,分析整理得到了80后年龄段与夫妇对数、夫妻双方家的距离有关,通过计算得到的数据,如下表4:
我们对表格中不同距离分布的人数绘制了如下图4所示的折线图:
图4 不同距离的频数分布图
(系列1-系列6表示1981—1986各年的夫妇对数在不同距离的分布情况) 通过折线图更能够反映出在同一时间调查的黄冈部分地区夫妻对数从1981年到1986年呈现出增加的趋势。也反映了大部分夫妇婚姻关系圈的距离范围都比较小,主要分布在0-10这一个距离范围之内。
3、问题三的求解:
3.1我们通过分析统计得到了表5中的数据我们发现婚姻关系大部分在83到85年,而且我们还用工具画出其散点图如图5,我们发现其变化趋势是先上升后下降的类似与抛物线形状。
图5
六、模型的评价
1、模型的优点:
1)在数据处理方面我们进行了多方面的对比最后都是为了说明一个方向的问题。
2)在模型的图像方面我们结合了折线图和表格一起的方式更能反映出问题关系。
七、参考文献
[1] 郭松义. 八十年代以来中国大陆婚姻,家庭史研究概述文学第六卷,1996. [2] 谭仁杰. 婚姻经济学. 河南人民出版社,1992. [3] 楚青兰. 婚姻网与人种. 文摘0网.
http://www.wenzhai.com/shehui/renzhong.htm.
题目: 黄冈市农村婚姻关系圈变化分析
【摘 要】
改革开放以来,农村婚姻圈的变化发生了显著的改变,本文从农村居民80后父母的婚配双方年龄,婚配家庭距离,居住地大小规模,居住地分布区域等因素作出分析。
本文采用统计分析对数据进行处理,并用excel 和matlab 对数据进行模拟绘图,并进行线性分析,得到以下结论:(1)本文采用最小二乘法对数据进行线性拟合,得到函数关系式
f (x ) =41.7309x +0.9243,并绘出折线图,编程进行
线性分析,R 2=1.000,P=0.00026
关键词:线性回归 拟合 回归分析 最小二乘法
一、 问题重述
随着城乡建设的步伐,越来越多的乡下人奔赴大城市找工作甚至安家落户,这就导致农村婚姻关系圈发生了变化。本文主要根据80年代初期统计了黄冈市内部分县级婚配关系数据,得到了影响80年代初期婚姻关系圈的一些影响因素,影响因素有自然村落、婚配双方之间的距离关系、婚配双方的年龄大小等。本文研究的问题主要是:
1. 婚配关系与自然村落的规模大小和地域的分布有关系? 2. 婚配关系与婚配双方居住地之间的距离的变化有关系? 3. 婚配关系与适婚年龄有关系?
二、 问题分析
本题主要是对黄冈婚姻关系圈的变化因素进行分析,对黄冈婚姻关系圈的发展趋势进行预测。
对于问题一,可以对已有的黄冈市附近部分县市的婚配关系的统计数据,对每一个地区的婚配关系单独进行分析处理,利用计算机作图,找出地域对婚配关系的影响情况。还可以将夫妇对数与自然村落规模大小做散点图,观察它们之间是否有关,还可以利用线性拟合的方式,找出这些离散点之间的函数关系式,就可以找出婚配关系与自然村落规模大小之间的关系。
对于问题二,通过提取整理夫妇对数与夫妇双方之间距离的分布的数据,采用分组的形式,利用matlab 编程绘制图像,观察图像的走向,看能否找到婚配关系与婚配双方居住地之间的距离的变化趋势。
对于问题三,统计了在不同年龄段夫妇婚配关系情况的数据,找出各年龄段夫妇对数的分布情况。
三、 模型的假设
1. 假设调查样本的选取是随机的。
2. 假设从1981年到1986年出生的孩子的父母的适婚年龄均在18—26岁之间。 3. 假设国家政策和地方人口迁移情况对本次调查的婚配关系没有影响。 4. 假设样本中的婚姻关系没有改变户籍状况。
四、符号说明
b :表示常数项和回归系数;
bint :表示常数项和回归系数对应的置信区间; r :表示残差;
rint :表示残差对应的置信区间;
stats :则分别对应拟合优度,F 值和P 值(统计量显著性概率);
五、模型的建立与求解
1、 问题一模型的建立与求解: 1.1、模型的建立:
对于问题一,要从两个方面的内容进行讨论:一个方面是通过对各个年龄段统计出来的出生地规模大小与夫妇对数分布情况进行统计分析,对出生地规模大小的影响进行一个综合评价;另一个方面是对各地区的婚姻关系分布情况做一个分析。
1.2、算法思想:
从给出的统计数据可以发现,很多的数据看起来杂乱无章,似乎没有什么规律可言,但是仔细分析后还是可以得到这样的结论:从全局上看,这些数据在整体上是上升的或者是下降的。所以在处理的过程中,可以采用线性最小二乘法进行拟合,利用matlab 进行编程,求解得到所要的函数关系式的相关系数,接下来用残差分析方法进行检验,判断这种拟合方式是否合理。 1.3、模型的求解:
1.3.1本文通过对黄冈市部分乡村婚配关系的距离调查数据,整理得到了80后父母的夫妇对数与其父亲所在地的规模大小的数据,具体数据如下表1:
作多项式f (x ) =a 1x +b 1,利用matlab 进行编程计算: x=[1 34 70 83 73 16]
y=[75 1393 3156 3084 3290 567] A=ployfit(x,y,1) Z=ployval(A,x)
plot(x,y,’k+’,x,Z, ’r ’)
xlabel(‘夫妇对数’) ;ylabel (‘出生地规模的大小’) 得到的相关系数为:
a 1=41.7309b 1=0.9243
Z=42.7 1419.8 2922.1 3464.6 3047.3 668.6
得到了夫妇对数与出生地规模大小之间的函数关系式为:
f (x ) =41.7309x +0.9243
得到的折线图如下图1:
图1 夫妇对数与出生地规模大小的关系
通过上图我们可以看出夫妇对数与出生地规模大小之间的关系是成正相关的。可以得到父亲出生地规模范围越大,夫妇对数也就越多。也说明了,现在人们的活动范围的扩大,人们选择配偶的范围也在扩大。
接下来,用线性回归的方法,来检验本文所得到的夫妇对数与出生地规模大小之间的函数关系式的拟合程度。 进行一元线性回归检验,建立模型
Y =b 0+b 1x 2+ε, ε
2
N (0, σ2)
其中,b 0,b 1,σ都是不依赖于x 的未知参数,b 1称为回归系数,编程如下: x=[1 1 1 1 1 1 ;1 34 70 83 73 16]'; y=[75 1393 3156 3084 3290 567]'; [b,bint,r,rint,stats]=regress(y,x) rcoplot(r,rint) 所得结果如下: b =
0.9243 41.7309 bint =
-528.6246 530.4732 32.2022 51.2596 r =
32.3448
-26.7743 233.9140 -380.5875 242.7213 -101.6184
rint =
-541.8539 606.5435 -774.8366 721.2881 -374.3614 842.1894 -587.7738 -173.4012 -341.0689 826.5116 -766.9432 563.7064
stats =
1.0e+004 *
0.0001 0.0148 0.0000 6.7641 得到如下残差分析图:
图2 残差图
我们此次做的数学线性回归均为简单的一元线性回归模拟:y=ax+b,采用matlab 进行区间估计和线性回归分析,在分析后所得数据中,b 表示常数项和回归系数,bint 表示常数项和回归系数对应的置信区间,r 表示残差,rint 表示残差对应的置信区间,stats 则分别对应拟合优度,F 值和P 值(统计量显著性概率),误差方差。
通过以上数据的检验,我们可以了解到:夫妇对数与出生地规模的大小,该回归方程的模拟程度较高,达至0.94,呈现分明的正相关,即女方更愿意嫁至男方所在地户口数更多的地方,而对于人烟稀少的地方则鲜有夫妇结婚居住,这也可以表明,80后青年更愿意生活在门庭若市的村镇而不愿意住在穷乡僻壤的山区,随着繁华村镇的不断发展,人口将进一步集中,而偏远地区则更加破落和荒芜。
1.3.2为了找出黄冈市部分乡村婚配关系与地域分布的关系,本文统计了不同地域的婚姻情况的分布如下表2所示:
本文又对表二当中的数据进行了处理,如下图3所示:
图3
通过上图很明显能够发现在随机统计的一组数据当中,其中黄梅、浠水和红安的夫妇对数最多,也说明了不同的地区的婚姻关系圈有所差异。即地区也是影响婚姻关系圈的变化的因素之一。
1.3.3通过对黄冈市部分乡村婚配关系的距离调查数据,我们统计了跨县结婚的数据如下表3所示:
表3 不同地区与婚姻关系的数据表
通过上表3的统计数据,显示出目前黄冈市跨县结婚的一个情况得到1984年以后出生的小孩的父母跨省结婚夫妇对数占整个调查婚姻关系圈人数的65.75%,那么就有理由相信现在的婚配关系圈会随着现代的发展越来越广,而且会被更多的人接受。
2、问题二的求解:
2.1 本文通过对黄冈市部分乡村婚配关系的距离调查数据,分析整理得到了80后年龄段与夫妇对数、夫妻双方家的距离有关,通过计算得到的数据,如下表4:
我们对表格中不同距离分布的人数绘制了如下图4所示的折线图:
图4 不同距离的频数分布图
(系列1-系列6表示1981—1986各年的夫妇对数在不同距离的分布情况) 通过折线图更能够反映出在同一时间调查的黄冈部分地区夫妻对数从1981年到1986年呈现出增加的趋势。也反映了大部分夫妇婚姻关系圈的距离范围都比较小,主要分布在0-10这一个距离范围之内。
3、问题三的求解:
3.1我们通过分析统计得到了表5中的数据我们发现婚姻关系大部分在83到85年,而且我们还用工具画出其散点图如图5,我们发现其变化趋势是先上升后下降的类似与抛物线形状。
图5
六、模型的评价
1、模型的优点:
1)在数据处理方面我们进行了多方面的对比最后都是为了说明一个方向的问题。
2)在模型的图像方面我们结合了折线图和表格一起的方式更能反映出问题关系。
七、参考文献
[1] 郭松义. 八十年代以来中国大陆婚姻,家庭史研究概述文学第六卷,1996. [2] 谭仁杰. 婚姻经济学. 河南人民出版社,1992. [3] 楚青兰. 婚姻网与人种. 文摘0网.
http://www.wenzhai.com/shehui/renzhong.htm.