城市勘测
撕年
5
文章编号:1672—8262(2007)05—48一03中图分类号:02ll文献标识码:B
理论平均值公式的建立及有关的理论基础
姜德国‘,周勇,跆;玲菊
(浙江玉环县城建测量队.浙江玉环317600)
摘要:建立了母体参数(弘,盯2)的坐标参考系;论证了随机变量的数学期望是永恒存在的,不必设定收敛条件;推导出了理论平均值公式.它的解位于算术平均值和中位值构成的解域之内。实验验证:理论平均值套式就是随机变量取值的数学期望(估计)计算公式。
关键词:母体坐标参考系;理论平均值;密虚权
l前言
长期以来,人们总是将概率论中的数学期望(预测)的观念直接搬人到数理统计巾,用于数理统计的参数估计。自1859年数学家卡・弗・高斯创立的最小二乘法和极大似然估计(实为算术平均值)一直沿用至今。又由契贝雪夫大数定律的推论
t
n
Ⅲ0有y~Ⅳ(O,1)
由于x与y同分布,因此有灿=o,(r2=l
(3)
(灿=o,一2=1)就是确定母体空间位置的坐标参考系。如果我们把母体(肛,口2)比作“物”,那么“物”的空间位置就是p;“物“的大小就是口2。母体可大到宇宙空
闽口2一*;也可小至一个质点口2—如,囚此常以o<,
<*来描述口2的取值。
1
limP([I÷三z,一pI≥P])=o
“
得到:实用上,往往用算术平均值x=÷蓦z.,来作为真
值口的近似值。
随着计算技术的自动化进程,人们已经发现了最小二乘估计受污染的脱测数据的严重影响,甚至导致估值的歪曲;于是创立了ROBusTEsⅡMATIoN(抗差估计)研究体系。然而由f抗差估计并未脱胎于最小二乘法,因此,无法彻底解决抗差问题。
本文从研究概率论中的数学期望(预测)与数理统计中的数学期望(估计)具有不同本质的事实出发,首先建立了母体参数的坐标参考系;并论证随机变量的数学期望的永恒存在,导出了理沧平均值;的公式,;总是位于算术平均值;和中位值i之间,从而解决了对具有异常子样的估计问题。
3随机变量工的数学期望E(x)(或E(*))总
是存在的,不受收敛条件的限制。
(1)离散型随机变量的数学期望总是存在的。证明如下:
E(x)=三t。pi
由于∑Pi=l,又由于≈来自母体,因此:
E(置)=层(三。护,)=E(Ⅳ)三P,=E(x)(2)连续型随机变量的数学期望总是存在的。证明如下:
E(互)2
,+∞
∞
∞
(4)
J。。《“x)出童墼,善zi“毛)/.;弘w-)
(5)(6)
令p,=,(z.)/∑以屯)且∑P。=1
2母体参数的坐标参考系
不管随机变量x是服从什么分布,记为盖一x(“,盯2)
由中心极限定律知,它的极限分布是正态分布
liln{x~盖(p,∥2)};互~^r(芦,口2)作变量代换y=生二世
(2)
离;
(1)
因此F(x)=E三%‘p.=层(x)三P;=E(x)
4概率论中随机变量x的数学期望是对母体中
心在f0,1)坐标参考系的空间位置的预测E(x)=肚一0——表示母体中心离坐标原点的距
・收稿日期:20∞—OI—25
作者简介:姜德国(1974~),男,工程师。从事测绘生产及质量管理工作。
万方数据
第5期姜德国等.理论平均值公式的建立厦有关的理论基础
D(置)=l×口2——表示母体的大小。
现在举一些常见的概率分布随机变量数学期掣和方差”J进行分析。
(1)二项分机的数学期望和方差
p(*=e)的数学期望:印表示为p的琊一项的空间位置;
D(置)=口2=哪,表示相应的大小。
分析:数学期望印,表示若在n次试行中,出现p项的事件的最大可能性是叩。
若n一*,则可以完全确定p值,因为盥詈=p,I『lj
这时口2=,w一*。这就是说,若取口2一m空问,则可
用试验的方法唯一地确定二项分布的p和q。
对于质量均匀的硬币,由于正面与反面的概率为÷,因此,我们可以预测:如果将硬币投掷n次,则出现
正面的最大可能性为÷‰
(2)均匀分布的数学期望和方差
E(x)=!i芒——空间位置
D(x):口z:掣——母体大小
分析:如果在[。,6]Ⅸ间取连续值x,期望值为
F(z)=笔尘;它表示对#取具体值屯(i=1,2,…,n)
的最大可能性的预测。
(3)正态分布的数学期望和方差
E(x)=弘——空间位置D(x)=∥2——母体大小
分析:若在一∞<g<+m取连续值鼍(i=l,2,…,n,…),且z.可正可负,又由契贝雪夫大数定律知
E(z)2嬲情孕・j~
(7)
如果不能取连续值*;(i=l,2,…,n),W,独立,那么母
体中心最可能的空间位置是算术平均值。
1
“
一吉,;屯
(4)柯西分布㈨的数学期犟
由于柯西分布的E(x)=f%“*)出不收敛,无
法求出数学期望,文献口1用推理的方法得出它的数学期望是中位值i(严格的证明见(12)式)
E(Ⅳ)=叠
(8)
分析:若在一∞<#<斗∞取连续的#=(xI,x2,…,x。,
万方数据
…),则有(8)式。如果z=(x,,x:,…,z。),则服从柯西分布的母体中心的空间位置最有可能是巾位值i。
综卜所述,慨率沦的数学期犟(预测)的本质是埘未来事件可能发生的预测。已知参数弘和一2,对取龃z进行预测。作为常用的预测指标是算术平均值*和中位值;。
5数理统计中随机变量x的数学期望是对母体
中心在(0,1)坐标参考系空间位置的估计
所谓预测,是对未来事件可能发生,可能不发生,发生的几率有多大的预测。反映在概率沧中的数学期望(预测)。由于每个事件置(i=1,2,…,n,…)发生的机会是相等的,如:
a<』<6
均匀分布
一∞<g<+*
正态分布,柯西分布,
所以用算术平均值z或中位值i作为预测值将是最可
靠的。
数理统计中随机变量x的数学期望(估汁)是对已发生事件可信度的评估”1。事件已经发生了,*.(i=1,2,…,n)已经实现了,在这种情况下,冉片j算术平均值;或中位值i对母体参数进行估计就不正确了。从而导致本文前言所阐述的弊端。应该用理论平均值;来取代算术平均值*和中位值i。这就是说:首先须对独立的每一个z.(f=1,2,・~,n)事件进行可靠性评定,然后计算它们的数学期望(估计)值。
设随机变量置的取值(样本)x,一m<#<+*则△~x—E(x)或写为△=≈一p(9)
△是真误差,△具有偶然误差性质,E(△)=O且△一Ⅳ(O,一)有
,+∞
,十∞
E(△)=o=f△^△)d△=J
(x—p),(*一肛)也
彗疆龇王(*;一p≯厂(并.一肛)/E厂(x.一p)
∞
*
三量t。一壶(”∥/主e一壶(一∥
得到p:塞卵一扫一∥/萎e一拇彬
(10)
由于o<盯2<+∞,当盯2_÷∞,则(Io)式为
,l
“
1
p2璺{音,善。t}2E(*)
(11)
这是正态分布的情况,当口2—+0,则只有*。=肛的密度
权
lime一壶(rp)2=lime一寺(o)2:1
一—+o
一_0
其余的札(%≮£)的密度权为零。于是由(10)式得到柯西分布的数学期望是中位值i,即
50
城市勘测
砌年
x=363.4.矿=±803.1
p
2}嚣正。E(z)
(12)
(13)
取p.=e寿‘一∥/i垂1e一壶‘一∥
式中P.为x,的概率。于是(10)式为
∞
未=63.7.孑=±870.2五=4.6.孑=±897.7
可以看出,x偏高;“偏低,而;适中。
为r榆验(14)式的正确性。我们用文献H1的算例进行检验。
例2设H挺钢筋的抗拉指标分别为
110,120,120,125,】25,125,130,130,135,140
肛2.;x-p-:E(x)
与(4)式同。我们称(10)式为理论平均值。数理统计中,已知条件是*.(i=l,2,…,n),待估计的最是p和∥2。这与概率论中的已知条件和所求条件正好相反的。下面推导求p、一的公式:因为
按(14)式求得平均抗拉指标为;=126与文献“3用数
一2,暑音(妒pr
顾及(10)式,得到求肛和口2的公式:
学期单公式1lo×击+120×孟+125×斋+130x孟
+135。南+140。南“26相同。
(16)式适用于自由子样一*<Ⅳ<+*的理论平均值;对于约束子样肛一孑<*‘p+≥,其中吾为先验标准差。由于母体大小为孑2已知,所以得到约束子样的理论平均值公式为:
p:芝叩一拇训”三e一知一”a2。善音("p)2
又由于x.(江1,2,…,H),所以将}:式改写为实用形
式:
五:±叩一扫一肼/主。一赤慨埘2
(16)
五:兰z.e一南c一二,2/圭e一赤“;一二”
冉击弘书:
;],简写成五E[i,;],称为估计域。且
lim茹=1im;=lim未=“
‘14’
参考文献
用(16)式可彻底解决因受污染影响的抗差估计问题。
迭代求解。求得的五以;表示,刚五=;。不难看出,
由于O<盯2<∞,而O<扩<∞,而*是矿2-十∞的解,
[1]刘蒂秦,张克仁.概率论与数理统计.上海:上海科学技术文献出版社.199I:Pj74.
即五=x;i是口2枷的解,即正=i;罔此必有五∈[i,;,
(15)
[2]陈希孺.概率论与数理统计.合肥:中国科学技术戈学出版社.1992
[3]黄杰权的公理化定艾厦其应用.测绘通报,1997(4):2
,4.
例l设有子样值
¥=(3.1。5.2。4.6,4.2,l800.O)
[4]王福保,李炳纠.概率论与数理统计.上海:同济大学出
版社,1994:Pf38
分别求;,;,i,得
The
EstablishmentoftheoreticalAverageValue
Formula
andRelatedRationale
JiangDeGuo,zhouYo“g,ChenLingJ“
(urbaⅡconstmction
surveyinggroup
ofl‰Huan
county,Yuhuan
317600,china)
onlyproVest11atrandom
deducesmeoreti。
Abstrad:Thepassageestablishedthematr—para而etefcoordinaterefbrence8ystem;It
v8rjable童mathmatican廿cipationalw8yse“standmustntcon矗gIlmtheconstIjngencycaIav。ragevalue
out
not
con肌ion,but出so
V“a1)le.
f0硼uIa
whosevalueisinthera“gebetweenarithmetic
av。嘲evaIuea11d
f0硼ula
nlediall.Theelpe订menttums
thattlleoreticalaveragevalue
f0珊ula
is
justmathem“cal
anⅡcipation
ofr出ldom
Keywords:matr—parametercoordinatereferencesystem;theoreticalaverage。alu8;densify
weight
万方数据
城市勘测
撕年
5
文章编号:1672—8262(2007)05—48一03中图分类号:02ll文献标识码:B
理论平均值公式的建立及有关的理论基础
姜德国‘,周勇,跆;玲菊
(浙江玉环县城建测量队.浙江玉环317600)
摘要:建立了母体参数(弘,盯2)的坐标参考系;论证了随机变量的数学期望是永恒存在的,不必设定收敛条件;推导出了理论平均值公式.它的解位于算术平均值和中位值构成的解域之内。实验验证:理论平均值套式就是随机变量取值的数学期望(估计)计算公式。
关键词:母体坐标参考系;理论平均值;密虚权
l前言
长期以来,人们总是将概率论中的数学期望(预测)的观念直接搬人到数理统计巾,用于数理统计的参数估计。自1859年数学家卡・弗・高斯创立的最小二乘法和极大似然估计(实为算术平均值)一直沿用至今。又由契贝雪夫大数定律的推论
t
n
Ⅲ0有y~Ⅳ(O,1)
由于x与y同分布,因此有灿=o,(r2=l
(3)
(灿=o,一2=1)就是确定母体空间位置的坐标参考系。如果我们把母体(肛,口2)比作“物”,那么“物”的空间位置就是p;“物“的大小就是口2。母体可大到宇宙空
闽口2一*;也可小至一个质点口2—如,囚此常以o<,
<*来描述口2的取值。
1
limP([I÷三z,一pI≥P])=o
“
得到:实用上,往往用算术平均值x=÷蓦z.,来作为真
值口的近似值。
随着计算技术的自动化进程,人们已经发现了最小二乘估计受污染的脱测数据的严重影响,甚至导致估值的歪曲;于是创立了ROBusTEsⅡMATIoN(抗差估计)研究体系。然而由f抗差估计并未脱胎于最小二乘法,因此,无法彻底解决抗差问题。
本文从研究概率论中的数学期望(预测)与数理统计中的数学期望(估计)具有不同本质的事实出发,首先建立了母体参数的坐标参考系;并论证随机变量的数学期望的永恒存在,导出了理沧平均值;的公式,;总是位于算术平均值;和中位值i之间,从而解决了对具有异常子样的估计问题。
3随机变量工的数学期望E(x)(或E(*))总
是存在的,不受收敛条件的限制。
(1)离散型随机变量的数学期望总是存在的。证明如下:
E(x)=三t。pi
由于∑Pi=l,又由于≈来自母体,因此:
E(置)=层(三。护,)=E(Ⅳ)三P,=E(x)(2)连续型随机变量的数学期望总是存在的。证明如下:
E(互)2
,+∞
∞
∞
(4)
J。。《“x)出童墼,善zi“毛)/.;弘w-)
(5)(6)
令p,=,(z.)/∑以屯)且∑P。=1
2母体参数的坐标参考系
不管随机变量x是服从什么分布,记为盖一x(“,盯2)
由中心极限定律知,它的极限分布是正态分布
liln{x~盖(p,∥2)};互~^r(芦,口2)作变量代换y=生二世
(2)
离;
(1)
因此F(x)=E三%‘p.=层(x)三P;=E(x)
4概率论中随机变量x的数学期望是对母体中
心在f0,1)坐标参考系的空间位置的预测E(x)=肚一0——表示母体中心离坐标原点的距
・收稿日期:20∞—OI—25
作者简介:姜德国(1974~),男,工程师。从事测绘生产及质量管理工作。
万方数据
第5期姜德国等.理论平均值公式的建立厦有关的理论基础
D(置)=l×口2——表示母体的大小。
现在举一些常见的概率分布随机变量数学期掣和方差”J进行分析。
(1)二项分机的数学期望和方差
p(*=e)的数学期望:印表示为p的琊一项的空间位置;
D(置)=口2=哪,表示相应的大小。
分析:数学期望印,表示若在n次试行中,出现p项的事件的最大可能性是叩。
若n一*,则可以完全确定p值,因为盥詈=p,I『lj
这时口2=,w一*。这就是说,若取口2一m空问,则可
用试验的方法唯一地确定二项分布的p和q。
对于质量均匀的硬币,由于正面与反面的概率为÷,因此,我们可以预测:如果将硬币投掷n次,则出现
正面的最大可能性为÷‰
(2)均匀分布的数学期望和方差
E(x)=!i芒——空间位置
D(x):口z:掣——母体大小
分析:如果在[。,6]Ⅸ间取连续值x,期望值为
F(z)=笔尘;它表示对#取具体值屯(i=1,2,…,n)
的最大可能性的预测。
(3)正态分布的数学期望和方差
E(x)=弘——空间位置D(x)=∥2——母体大小
分析:若在一∞<g<+m取连续值鼍(i=l,2,…,n,…),且z.可正可负,又由契贝雪夫大数定律知
E(z)2嬲情孕・j~
(7)
如果不能取连续值*;(i=l,2,…,n),W,独立,那么母
体中心最可能的空间位置是算术平均值。
1
“
一吉,;屯
(4)柯西分布㈨的数学期犟
由于柯西分布的E(x)=f%“*)出不收敛,无
法求出数学期望,文献口1用推理的方法得出它的数学期望是中位值i(严格的证明见(12)式)
E(Ⅳ)=叠
(8)
分析:若在一∞<#<斗∞取连续的#=(xI,x2,…,x。,
万方数据
…),则有(8)式。如果z=(x,,x:,…,z。),则服从柯西分布的母体中心的空间位置最有可能是巾位值i。
综卜所述,慨率沦的数学期犟(预测)的本质是埘未来事件可能发生的预测。已知参数弘和一2,对取龃z进行预测。作为常用的预测指标是算术平均值*和中位值;。
5数理统计中随机变量x的数学期望是对母体
中心在(0,1)坐标参考系空间位置的估计
所谓预测,是对未来事件可能发生,可能不发生,发生的几率有多大的预测。反映在概率沧中的数学期望(预测)。由于每个事件置(i=1,2,…,n,…)发生的机会是相等的,如:
a<』<6
均匀分布
一∞<g<+*
正态分布,柯西分布,
所以用算术平均值z或中位值i作为预测值将是最可
靠的。
数理统计中随机变量x的数学期望(估汁)是对已发生事件可信度的评估”1。事件已经发生了,*.(i=1,2,…,n)已经实现了,在这种情况下,冉片j算术平均值;或中位值i对母体参数进行估计就不正确了。从而导致本文前言所阐述的弊端。应该用理论平均值;来取代算术平均值*和中位值i。这就是说:首先须对独立的每一个z.(f=1,2,・~,n)事件进行可靠性评定,然后计算它们的数学期望(估计)值。
设随机变量置的取值(样本)x,一m<#<+*则△~x—E(x)或写为△=≈一p(9)
△是真误差,△具有偶然误差性质,E(△)=O且△一Ⅳ(O,一)有
,+∞
,十∞
E(△)=o=f△^△)d△=J
(x—p),(*一肛)也
彗疆龇王(*;一p≯厂(并.一肛)/E厂(x.一p)
∞
*
三量t。一壶(”∥/主e一壶(一∥
得到p:塞卵一扫一∥/萎e一拇彬
(10)
由于o<盯2<+∞,当盯2_÷∞,则(Io)式为
,l
“
1
p2璺{音,善。t}2E(*)
(11)
这是正态分布的情况,当口2—+0,则只有*。=肛的密度
权
lime一壶(rp)2=lime一寺(o)2:1
一—+o
一_0
其余的札(%≮£)的密度权为零。于是由(10)式得到柯西分布的数学期望是中位值i,即
50
城市勘测
砌年
x=363.4.矿=±803.1
p
2}嚣正。E(z)
(12)
(13)
取p.=e寿‘一∥/i垂1e一壶‘一∥
式中P.为x,的概率。于是(10)式为
∞
未=63.7.孑=±870.2五=4.6.孑=±897.7
可以看出,x偏高;“偏低,而;适中。
为r榆验(14)式的正确性。我们用文献H1的算例进行检验。
例2设H挺钢筋的抗拉指标分别为
110,120,120,125,】25,125,130,130,135,140
肛2.;x-p-:E(x)
与(4)式同。我们称(10)式为理论平均值。数理统计中,已知条件是*.(i=l,2,…,n),待估计的最是p和∥2。这与概率论中的已知条件和所求条件正好相反的。下面推导求p、一的公式:因为
按(14)式求得平均抗拉指标为;=126与文献“3用数
一2,暑音(妒pr
顾及(10)式,得到求肛和口2的公式:
学期单公式1lo×击+120×孟+125×斋+130x孟
+135。南+140。南“26相同。
(16)式适用于自由子样一*<Ⅳ<+*的理论平均值;对于约束子样肛一孑<*‘p+≥,其中吾为先验标准差。由于母体大小为孑2已知,所以得到约束子样的理论平均值公式为:
p:芝叩一拇训”三e一知一”a2。善音("p)2
又由于x.(江1,2,…,H),所以将}:式改写为实用形
式:
五:±叩一扫一肼/主。一赤慨埘2
(16)
五:兰z.e一南c一二,2/圭e一赤“;一二”
冉击弘书:
;],简写成五E[i,;],称为估计域。且
lim茹=1im;=lim未=“
‘14’
参考文献
用(16)式可彻底解决因受污染影响的抗差估计问题。
迭代求解。求得的五以;表示,刚五=;。不难看出,
由于O<盯2<∞,而O<扩<∞,而*是矿2-十∞的解,
[1]刘蒂秦,张克仁.概率论与数理统计.上海:上海科学技术文献出版社.199I:Pj74.
即五=x;i是口2枷的解,即正=i;罔此必有五∈[i,;,
(15)
[2]陈希孺.概率论与数理统计.合肥:中国科学技术戈学出版社.1992
[3]黄杰权的公理化定艾厦其应用.测绘通报,1997(4):2
,4.
例l设有子样值
¥=(3.1。5.2。4.6,4.2,l800.O)
[4]王福保,李炳纠.概率论与数理统计.上海:同济大学出
版社,1994:Pf38
分别求;,;,i,得
The
EstablishmentoftheoreticalAverageValue
Formula
andRelatedRationale
JiangDeGuo,zhouYo“g,ChenLingJ“
(urbaⅡconstmction
surveyinggroup
ofl‰Huan
county,Yuhuan
317600,china)
onlyproVest11atrandom
deducesmeoreti。
Abstrad:Thepassageestablishedthematr—para而etefcoordinaterefbrence8ystem;It
v8rjable童mathmatican廿cipationalw8yse“standmustntcon矗gIlmtheconstIjngencycaIav。ragevalue
out
not
con肌ion,but出so
V“a1)le.
f0硼uIa
whosevalueisinthera“gebetweenarithmetic
av。嘲evaIuea11d
f0硼ula
nlediall.Theelpe订menttums
thattlleoreticalaveragevalue
f0珊ula
is
justmathem“cal
anⅡcipation
ofr出ldom
Keywords:matr—parametercoordinatereferencesystem;theoreticalaverage。alu8;densify
weight
万方数据