理论平均值公式的建立及有关的理论基础

城市勘测

撕年

文章编号:1672—8262(2007)05—48一03中图分类号:02ll文献标识码:B

理论平均值公式的建立及有关的理论基础

姜德国‘,周勇,跆;玲菊

(浙江玉环县城建测量队.浙江玉环317600)

摘要:建立了母体参数(弘,盯2)的坐标参考系;论证了随机变量的数学期望是永恒存在的,不必设定收敛条件;推导出了理论平均值公式.它的解位于算术平均值和中位值构成的解域之内。实验验证:理论平均值套式就是随机变量取值的数学期望(估计)计算公式。

关键词:母体坐标参考系;理论平均值;密虚权

l前言

长期以来,人们总是将概率论中的数学期望(预测)的观念直接搬人到数理统计巾,用于数理统计的参数估计。自1859年数学家卡・弗・高斯创立的最小二乘法和极大似然估计(实为算术平均值)一直沿用至今。又由契贝雪夫大数定律的推论

Ⅲ0有y~Ⅳ(O,1)

由于x与y同分布,因此有灿=o,(r2=l

(3)

(灿=o,一2=1)就是确定母体空间位置的坐标参考系。如果我们把母体(肛,口2)比作“物”,那么“物”的空间位置就是p;“物“的大小就是口2。母体可大到宇宙空

闽口2一*;也可小至一个质点口2—如,囚此常以o<,

<*来描述口2的取值。

limP([I÷三z,一pI≥P])=o

得到:实用上,往往用算术平均值x=÷蓦z.,来作为真

值口的近似值。

随着计算技术的自动化进程,人们已经发现了最小二乘估计受污染的脱测数据的严重影响,甚至导致估值的歪曲;于是创立了ROBusTEsⅡMATIoN(抗差估计)研究体系。然而由f抗差估计并未脱胎于最小二乘法,因此,无法彻底解决抗差问题。

本文从研究概率论中的数学期望(预测)与数理统计中的数学期望(估计)具有不同本质的事实出发,首先建立了母体参数的坐标参考系;并论证随机变量的数学期望的永恒存在,导出了理沧平均值;的公式,;总是位于算术平均值;和中位值i之间,从而解决了对具有异常子样的估计问题。

3随机变量工的数学期望E(x)(或E(*))总

是存在的,不受收敛条件的限制。

(1)离散型随机变量的数学期望总是存在的。证明如下:

E(x)=三t。pi

由于∑Pi=l,又由于≈来自母体,因此:

E(置)=层(三。护,)=E(Ⅳ)三P,=E(x)(2)连续型随机变量的数学期望总是存在的。证明如下:

E(互)2

,+∞

(4)

J。。《“x)出童墼,善zi“毛)/.;弘w-)

(5)(6)

令p,=,(z.)/∑以屯)且∑P。=1

2母体参数的坐标参考系

不管随机变量x是服从什么分布,记为盖一x(“,盯2)

由中心极限定律知,它的极限分布是正态分布

liln{x~盖(p,∥2)};互~^r(芦,口2)作变量代换y=生二世

(2)

离;

(1)

因此F(x)=E三%‘p.=层(x)三P;=E(x)

4概率论中随机变量x的数学期望是对母体中

心在f0,1)坐标参考系的空间位置的预测E(x)=肚一0——表示母体中心离坐标原点的距

・收稿日期:20∞—OI—25

作者简介:姜德国(1974~),男,工程师。从事测绘生产及质量管理工作。

万方数据

第5期姜德国等.理论平均值公式的建立厦有关的理论基础

D(置)=l×口2——表示母体的大小。

现在举一些常见的概率分布随机变量数学期掣和方差”J进行分析。

(1)二项分机的数学期望和方差

p(*=e)的数学期望:印表示为p的琊一项的空间位置;

D(置)=口2=哪,表示相应的大小。

分析:数学期望印,表示若在n次试行中,出现p项的事件的最大可能性是叩。

若n一*,则可以完全确定p值,因为盥詈=p,I『lj

这时口2=,w一*。这就是说,若取口2一m空问,则可

用试验的方法唯一地确定二项分布的p和q。

对于质量均匀的硬币,由于正面与反面的概率为÷,因此,我们可以预测:如果将硬币投掷n次,则出现

正面的最大可能性为÷‰

(2)均匀分布的数学期望和方差

E(x)=!i芒——空间位置

D(x):口z:掣——母体大小

分析:如果在[。,6]Ⅸ间取连续值x,期望值为

F(z)=笔尘;它表示对#取具体值屯(i=1,2,…,n)

的最大可能性的预测。

(3)正态分布的数学期望和方差

E(x)=弘——空间位置D(x)=∥2——母体大小

分析:若在一∞<g<+m取连续值鼍(i=l,2,…,n,…),且z.可正可负,又由契贝雪夫大数定律知

E(z)2嬲情孕・j~

(7)

如果不能取连续值*;(i=l,2,…,n),W,独立,那么母

体中心最可能的空间位置是算术平均值。

一吉,;屯

(4)柯西分布㈨的数学期犟

由于柯西分布的E(x)=f%“*)出不收敛,无

法求出数学期望,文献口1用推理的方法得出它的数学期望是中位值i(严格的证明见(12)式)

E(Ⅳ)=叠

(8)

分析:若在一∞<#<斗∞取连续的#=(xI,x2,…,x。,

万方数据

…),则有(8)式。如果z=(x,,x:,…,z。),则服从柯西分布的母体中心的空间位置最有可能是巾位值i。

综卜所述,慨率沦的数学期犟(预测)的本质是埘未来事件可能发生的预测。已知参数弘和一2,对取龃z进行预测。作为常用的预测指标是算术平均值*和中位值;。

5数理统计中随机变量x的数学期望是对母体

中心在(0,1)坐标参考系空间位置的估计

所谓预测,是对未来事件可能发生,可能不发生,发生的几率有多大的预测。反映在概率沧中的数学期望(预测)。由于每个事件置(i=1,2,…,n,…)发生的机会是相等的,如:

a<』<6

均匀分布

一∞<g<+*

正态分布,柯西分布,

所以用算术平均值z或中位值i作为预测值将是最可

靠的。

数理统计中随机变量x的数学期望(估汁)是对已发生事件可信度的评估”1。事件已经发生了,*.(i=1,2,…,n)已经实现了,在这种情况下,冉片j算术平均值;或中位值i对母体参数进行估计就不正确了。从而导致本文前言所阐述的弊端。应该用理论平均值;来取代算术平均值*和中位值i。这就是说:首先须对独立的每一个z.(f=1,2,・~,n)事件进行可靠性评定,然后计算它们的数学期望(估计)值。

设随机变量置的取值(样本)x,一m<#<+*则△~x—E(x)或写为△=≈一p(9)

△是真误差,△具有偶然误差性质,E(△)=O且△一Ⅳ(O,一)有

,+∞

,十∞

E(△)=o=f△^△)d△=J

(x—p),(*一肛)也

彗疆龇王(*;一p≯厂(并.一肛)/E厂(x.一p)

三量t。一壶(”∥/主e一壶(一∥

得到p:塞卵一扫一∥/萎e一拇彬

(10)

由于o<盯2<+∞,当盯2_÷∞,则(Io)式为

,l

p2璺{音,善。t}2E(*)

(11)

这是正态分布的情况,当口2—+0,则只有*。=肛的密度

lime一壶(rp)2=lime一寺(o)2:1

一—+o

一_0

其余的札(%≮£)的密度权为零。于是由(10)式得到柯西分布的数学期望是中位值i,即

50

城市勘测

砌年

x=363.4.矿=±803.1

2}嚣正。E(z)

(12)

(13)

取p.=e寿‘一∥/i垂1e一壶‘一∥

式中P.为x,的概率。于是(10)式为

未=63.7.孑=±870.2五=4.6.孑=±897.7

可以看出,x偏高;“偏低,而;适中。

为r榆验(14)式的正确性。我们用文献H1的算例进行检验。

例2设H挺钢筋的抗拉指标分别为

110,120,120,125,】25,125,130,130,135,140

肛2.;x-p-:E(x)

与(4)式同。我们称(10)式为理论平均值。数理统计中,已知条件是*.(i=l,2,…,n),待估计的最是p和∥2。这与概率论中的已知条件和所求条件正好相反的。下面推导求p、一的公式:因为

按(14)式求得平均抗拉指标为;=126与文献“3用数

一2,暑音(妒pr

顾及(10)式,得到求肛和口2的公式:

学期单公式1lo×击+120×孟+125×斋+130x孟

+135。南+140。南“26相同。

(16)式适用于自由子样一*<Ⅳ<+*的理论平均值;对于约束子样肛一孑<*‘p+≥,其中吾为先验标准差。由于母体大小为孑2已知,所以得到约束子样的理论平均值公式为:

p:芝叩一拇训”三e一知一”a2。善音("p)2

又由于x.(江1,2,…,H),所以将}:式改写为实用形

式:

五:±叩一扫一肼/主。一赤慨埘2

(16)

五:兰z.e一南c一二,2/圭e一赤“;一二”

冉击弘书:

;],简写成五E[i,;],称为估计域。且

lim茹=1im;=lim未=“

‘14’

参考文献

用(16)式可彻底解决因受污染影响的抗差估计问题。

迭代求解。求得的五以;表示,刚五=;。不难看出,

由于O<盯2<∞,而O<扩<∞,而*是矿2-十∞的解,

[1]刘蒂秦,张克仁.概率论与数理统计.上海:上海科学技术文献出版社.199I:Pj74.

即五=x;i是口2枷的解,即正=i;罔此必有五∈[i,;,

(15)

[2]陈希孺.概率论与数理统计.合肥:中国科学技术戈学出版社.1992

[3]黄杰权的公理化定艾厦其应用.测绘通报,1997(4):2

,4.

例l设有子样值

¥=(3.1。5.2。4.6,4.2,l800.O)

[4]王福保,李炳纠.概率论与数理统计.上海:同济大学出

版社,1994:Pf38

分别求;,;,i,得

The

EstablishmentoftheoreticalAverageValue

Formula

andRelatedRationale

JiangDeGuo,zhouYo“g,ChenLingJ“

(urbaⅡconstmction

surveyinggroup

ofl‰Huan

county,Yuhuan

317600,china)

onlyproVest11atrandom

deducesmeoreti。

Abstrad:Thepassageestablishedthematr—para而etefcoordinaterefbrence8ystem;It

v8rjable童mathmatican廿cipationalw8yse“standmustntcon矗gIlmtheconstIjngencycaIav。ragevalue

out

not

con肌ion,but出so

V“a1)le.

f0硼uIa

whosevalueisinthera“gebetweenarithmetic

av。嘲evaIuea11d

f0硼ula

nlediall.Theelpe订menttums

thattlleoreticalaveragevalue

f0珊ula

is

justmathem“cal

anⅡcipation

ofr出ldom

Keywords:matr—parametercoordinatereferencesystem;theoreticalaverage。alu8;densify

weight

万方数据

城市勘测

撕年

文章编号:1672—8262(2007)05—48一03中图分类号:02ll文献标识码:B

理论平均值公式的建立及有关的理论基础

姜德国‘,周勇,跆;玲菊

(浙江玉环县城建测量队.浙江玉环317600)

摘要:建立了母体参数(弘,盯2)的坐标参考系;论证了随机变量的数学期望是永恒存在的,不必设定收敛条件;推导出了理论平均值公式.它的解位于算术平均值和中位值构成的解域之内。实验验证:理论平均值套式就是随机变量取值的数学期望(估计)计算公式。

关键词:母体坐标参考系;理论平均值;密虚权

l前言

长期以来,人们总是将概率论中的数学期望(预测)的观念直接搬人到数理统计巾,用于数理统计的参数估计。自1859年数学家卡・弗・高斯创立的最小二乘法和极大似然估计(实为算术平均值)一直沿用至今。又由契贝雪夫大数定律的推论

Ⅲ0有y~Ⅳ(O,1)

由于x与y同分布,因此有灿=o,(r2=l

(3)

(灿=o,一2=1)就是确定母体空间位置的坐标参考系。如果我们把母体(肛,口2)比作“物”,那么“物”的空间位置就是p;“物“的大小就是口2。母体可大到宇宙空

闽口2一*;也可小至一个质点口2—如,囚此常以o<,

<*来描述口2的取值。

limP([I÷三z,一pI≥P])=o

得到:实用上,往往用算术平均值x=÷蓦z.,来作为真

值口的近似值。

随着计算技术的自动化进程,人们已经发现了最小二乘估计受污染的脱测数据的严重影响,甚至导致估值的歪曲;于是创立了ROBusTEsⅡMATIoN(抗差估计)研究体系。然而由f抗差估计并未脱胎于最小二乘法,因此,无法彻底解决抗差问题。

本文从研究概率论中的数学期望(预测)与数理统计中的数学期望(估计)具有不同本质的事实出发,首先建立了母体参数的坐标参考系;并论证随机变量的数学期望的永恒存在,导出了理沧平均值;的公式,;总是位于算术平均值;和中位值i之间,从而解决了对具有异常子样的估计问题。

3随机变量工的数学期望E(x)(或E(*))总

是存在的,不受收敛条件的限制。

(1)离散型随机变量的数学期望总是存在的。证明如下:

E(x)=三t。pi

由于∑Pi=l,又由于≈来自母体,因此:

E(置)=层(三。护,)=E(Ⅳ)三P,=E(x)(2)连续型随机变量的数学期望总是存在的。证明如下:

E(互)2

,+∞

(4)

J。。《“x)出童墼,善zi“毛)/.;弘w-)

(5)(6)

令p,=,(z.)/∑以屯)且∑P。=1

2母体参数的坐标参考系

不管随机变量x是服从什么分布,记为盖一x(“,盯2)

由中心极限定律知,它的极限分布是正态分布

liln{x~盖(p,∥2)};互~^r(芦,口2)作变量代换y=生二世

(2)

离;

(1)

因此F(x)=E三%‘p.=层(x)三P;=E(x)

4概率论中随机变量x的数学期望是对母体中

心在f0,1)坐标参考系的空间位置的预测E(x)=肚一0——表示母体中心离坐标原点的距

・收稿日期:20∞—OI—25

作者简介:姜德国(1974~),男,工程师。从事测绘生产及质量管理工作。

万方数据

第5期姜德国等.理论平均值公式的建立厦有关的理论基础

D(置)=l×口2——表示母体的大小。

现在举一些常见的概率分布随机变量数学期掣和方差”J进行分析。

(1)二项分机的数学期望和方差

p(*=e)的数学期望:印表示为p的琊一项的空间位置;

D(置)=口2=哪,表示相应的大小。

分析:数学期望印,表示若在n次试行中,出现p项的事件的最大可能性是叩。

若n一*,则可以完全确定p值,因为盥詈=p,I『lj

这时口2=,w一*。这就是说,若取口2一m空问,则可

用试验的方法唯一地确定二项分布的p和q。

对于质量均匀的硬币,由于正面与反面的概率为÷,因此,我们可以预测:如果将硬币投掷n次,则出现

正面的最大可能性为÷‰

(2)均匀分布的数学期望和方差

E(x)=!i芒——空间位置

D(x):口z:掣——母体大小

分析:如果在[。,6]Ⅸ间取连续值x,期望值为

F(z)=笔尘;它表示对#取具体值屯(i=1,2,…,n)

的最大可能性的预测。

(3)正态分布的数学期望和方差

E(x)=弘——空间位置D(x)=∥2——母体大小

分析:若在一∞<g<+m取连续值鼍(i=l,2,…,n,…),且z.可正可负,又由契贝雪夫大数定律知

E(z)2嬲情孕・j~

(7)

如果不能取连续值*;(i=l,2,…,n),W,独立,那么母

体中心最可能的空间位置是算术平均值。

一吉,;屯

(4)柯西分布㈨的数学期犟

由于柯西分布的E(x)=f%“*)出不收敛,无

法求出数学期望,文献口1用推理的方法得出它的数学期望是中位值i(严格的证明见(12)式)

E(Ⅳ)=叠

(8)

分析:若在一∞<#<斗∞取连续的#=(xI,x2,…,x。,

万方数据

…),则有(8)式。如果z=(x,,x:,…,z。),则服从柯西分布的母体中心的空间位置最有可能是巾位值i。

综卜所述,慨率沦的数学期犟(预测)的本质是埘未来事件可能发生的预测。已知参数弘和一2,对取龃z进行预测。作为常用的预测指标是算术平均值*和中位值;。

5数理统计中随机变量x的数学期望是对母体

中心在(0,1)坐标参考系空间位置的估计

所谓预测,是对未来事件可能发生,可能不发生,发生的几率有多大的预测。反映在概率沧中的数学期望(预测)。由于每个事件置(i=1,2,…,n,…)发生的机会是相等的,如:

a<』<6

均匀分布

一∞<g<+*

正态分布,柯西分布,

所以用算术平均值z或中位值i作为预测值将是最可

靠的。

数理统计中随机变量x的数学期望(估汁)是对已发生事件可信度的评估”1。事件已经发生了,*.(i=1,2,…,n)已经实现了,在这种情况下,冉片j算术平均值;或中位值i对母体参数进行估计就不正确了。从而导致本文前言所阐述的弊端。应该用理论平均值;来取代算术平均值*和中位值i。这就是说:首先须对独立的每一个z.(f=1,2,・~,n)事件进行可靠性评定,然后计算它们的数学期望(估计)值。

设随机变量置的取值(样本)x,一m<#<+*则△~x—E(x)或写为△=≈一p(9)

△是真误差,△具有偶然误差性质,E(△)=O且△一Ⅳ(O,一)有

,+∞

,十∞

E(△)=o=f△^△)d△=J

(x—p),(*一肛)也

彗疆龇王(*;一p≯厂(并.一肛)/E厂(x.一p)

三量t。一壶(”∥/主e一壶(一∥

得到p:塞卵一扫一∥/萎e一拇彬

(10)

由于o<盯2<+∞,当盯2_÷∞,则(Io)式为

,l

p2璺{音,善。t}2E(*)

(11)

这是正态分布的情况,当口2—+0,则只有*。=肛的密度

lime一壶(rp)2=lime一寺(o)2:1

一—+o

一_0

其余的札(%≮£)的密度权为零。于是由(10)式得到柯西分布的数学期望是中位值i,即

50

城市勘测

砌年

x=363.4.矿=±803.1

2}嚣正。E(z)

(12)

(13)

取p.=e寿‘一∥/i垂1e一壶‘一∥

式中P.为x,的概率。于是(10)式为

未=63.7.孑=±870.2五=4.6.孑=±897.7

可以看出,x偏高;“偏低,而;适中。

为r榆验(14)式的正确性。我们用文献H1的算例进行检验。

例2设H挺钢筋的抗拉指标分别为

110,120,120,125,】25,125,130,130,135,140

肛2.;x-p-:E(x)

与(4)式同。我们称(10)式为理论平均值。数理统计中,已知条件是*.(i=l,2,…,n),待估计的最是p和∥2。这与概率论中的已知条件和所求条件正好相反的。下面推导求p、一的公式:因为

按(14)式求得平均抗拉指标为;=126与文献“3用数

一2,暑音(妒pr

顾及(10)式,得到求肛和口2的公式:

学期单公式1lo×击+120×孟+125×斋+130x孟

+135。南+140。南“26相同。

(16)式适用于自由子样一*<Ⅳ<+*的理论平均值;对于约束子样肛一孑<*‘p+≥,其中吾为先验标准差。由于母体大小为孑2已知,所以得到约束子样的理论平均值公式为:

p:芝叩一拇训”三e一知一”a2。善音("p)2

又由于x.(江1,2,…,H),所以将}:式改写为实用形

式:

五:±叩一扫一肼/主。一赤慨埘2

(16)

五:兰z.e一南c一二,2/圭e一赤“;一二”

冉击弘书:

;],简写成五E[i,;],称为估计域。且

lim茹=1im;=lim未=“

‘14’

参考文献

用(16)式可彻底解决因受污染影响的抗差估计问题。

迭代求解。求得的五以;表示,刚五=;。不难看出,

由于O<盯2<∞,而O<扩<∞,而*是矿2-十∞的解,

[1]刘蒂秦,张克仁.概率论与数理统计.上海:上海科学技术文献出版社.199I:Pj74.

即五=x;i是口2枷的解,即正=i;罔此必有五∈[i,;,

(15)

[2]陈希孺.概率论与数理统计.合肥:中国科学技术戈学出版社.1992

[3]黄杰权的公理化定艾厦其应用.测绘通报,1997(4):2

,4.

例l设有子样值

¥=(3.1。5.2。4.6,4.2,l800.O)

[4]王福保,李炳纠.概率论与数理统计.上海:同济大学出

版社,1994:Pf38

分别求;,;,i,得

The

EstablishmentoftheoreticalAverageValue

Formula

andRelatedRationale

JiangDeGuo,zhouYo“g,ChenLingJ“

(urbaⅡconstmction

surveyinggroup

ofl‰Huan

county,Yuhuan

317600,china)

onlyproVest11atrandom

deducesmeoreti。

Abstrad:Thepassageestablishedthematr—para而etefcoordinaterefbrence8ystem;It

v8rjable童mathmatican廿cipationalw8yse“standmustntcon矗gIlmtheconstIjngencycaIav。ragevalue

out

not

con肌ion,but出so

V“a1)le.

f0硼uIa

whosevalueisinthera“gebetweenarithmetic

av。嘲evaIuea11d

f0硼ula

nlediall.Theelpe订menttums

thattlleoreticalaveragevalue

f0珊ula

is

justmathem“cal

anⅡcipation

ofr出ldom

Keywords:matr—parametercoordinatereferencesystem;theoreticalaverage。alu8;densify

weight

万方数据


相关文章

  • 水面蒸发量的预测
  • ---------------<水资源研究>第25卷 第2期(总第91期)2004年6月--------------- 水面蒸发量的预测 闵 骞 (江西省水利厅 鄱阳湖水文分局,江西 星子 332800) 摘 要: 提出以气象预 ...查看


  • 河流泥沙研究进展
  • 河流泥沙研究进展 班级 20101501 学号 2010150131 作者 刘力 摘要:泥沙研究主要是认识水流中的泥沙运动规律.河床演变规律, 进而解决水利工程中的泥沙问题.泥沙学科体系始建于20世纪, 侧重河流泥沙研究.河流泥沙运动力学基 ...查看


  • [统计学原理]课程课程一体化方案
  • <统计学原理>课程课程一体化方案 一.课程的性质和特点 统计学原理是为广播电视大学经济与管理学科各专业学生开设的一门必修 基础课,也是经济管理工作者和经济研究人员应该必备的一门知识.它研究如 何用科学的方法去搜集.整理.分析国民 ...查看


  • 经典测验理论和项目反应理论的区别与联系_李夏妍
  • 2008年03月 第14卷 第2期内蒙古民族大学学报Jour na lo f I nnerM ongo li a U niversity for N ati o na lities M ar . 2008V o. l 14 No . 2经典 ...查看


  • 0278 社会统计学
  • 湖北省高等教育自学考试大纲 课程名称:社会统计学 课程代码:0278 第一部分 课程性质与目标 一.课程性质与特点 <社会统计学>是湖北省高等教育自学考试社会工作与管理专业开设的一门专业课程, 侧重介绍调查资料的收集.整理.分析 ...查看


  • 2.[物理化学]教学大纲(化学专业)
  • <物理化学>课程教学大纲 一.课程基本信息 (一)课程中文名称:物理化学 (二)课程英文名称:Physical Chemistry (三)课程代码:15030100 15030101 (四)课程属性及模块:专业必修课 (五)授课 ...查看


  • 固体颗粒的群体沉降速度分析
  • 固体颗粒的群体沉降速度分析 郑邦民,夏军强12 (1.武汉大学 河流系,湖北 武汉430072; 2.清华大学 水利系,北京100084) 摘要:从流体力学原理出发,数值模拟非均匀沙随机分布对流场的影响,推导出固体颗粒群体沉速的理论解.该公 ...查看


  • 劳动定员定额标准的制定
  • 劳动定员定额标准的制定 王志滨 2012-11-1 9:56:28 来源:<人力资源开发与管理>2012年第2期 劳动定员定额标准的制定 科学合理地确定从事不同性质的工作,具有不同劳动强度及不同作业环境的各岗位的劳动时间,是制定 ...查看


  • 区域尺度水资源短缺风险评估与决策体系_以京津唐地区为例
  • 第29卷第9期2010年09月 地理科学进展 PROGRESSINGEOGRAPHY Vol.29,No.9Sept.,2010 区域尺度水资源短缺风险评估与决策体系 ---以京津唐地区为例 22 李九一1,李丽娟1,柳玉梅1,,梁丽乔1, ...查看


热门内容