对分层抽样设计的改进

作者:彭念一陈曜

《统计研究》 2001年03期

  在社会经济研究中,由于实际条件的限制,往往采用抽样调查的方法获得现象总体的信息,当总体内部差异比较大时,应首先对总体各单位按有关标志加以分层,然后再从各层中按随机原则抽选一定单位构成样本。分层可以大大提高抽样推断的精度,降低工作量和成本,所以实际工作中分层抽样得到了最为广泛的应用。

  样本分配是分层抽样研究的一个重要方面。影响样本分配的因素主要有:各层方差、各层样本单位数、调查成本等,其中调查成本是与实际工作有密切影响的因素。当存在多个项目同时进行调查时,必须考虑综合成本最小化问题。本文即从理论上考查多项目场合中调查成本与调查精度之间的函数关系,为实际工作中的多目标决策提供思路。

  一、单目标条件下调查成本与抽样误差之间的函数关系

  设:全及总体分为k层;

  全及总体单位数为N,各层单位数为N[,i],(i=1,2,…,k);

  各层的层权为W[,i]=N[,i]/N,(i=1,2,…,k);

  总样本容量为n,从每个层内抽取的样本数记为n[,i],(i=1,2,…,k);

  

  从各层中抽取一样本单位的成本C[,i],(i=1,2,…,k);

  各层内方差为V[,i],标准差为σ[,i],(i=1,2,…,k);

  调查的总成本C=C(C[,0];C[,1];C[,2],…,C[,k];n[,1],n[,2],…,n[,k]),即:C′代表可变成本,即:

  

  其中C[,0]代表固定成本,它是指随被调查单位增多而增加的成本部分。

  按分层抽样规则,抽样平均误差是各层样本数目n[,i]的函数V=V(n[,1],n[,2],…,n[,k]),

  

  按最优分配法,当各层所分得样本容量为n[,1],n[,2],…,n[,k]时,对于给定的调查总费用C,令总的抽样平均误差达最小值V[*],求得:各层单位数最优分配如下(奈曼分配)[1]:

  

  注意一旦调查总体确定,W[,i]、V[,i]、C[,i]都是常数,同时C、C[,0]也是定值,所以n[*,1]、n[*,2],…,n[*,k]和V[*]都是唯一的,即最优解是唯一的。

  但是,调查经费是如何确定的呢?仅按照以上结论,有没有可能确定这笔调查经费的边际效率是多少?即在此基础上每追加单位经费,可以带来的误差降低量是多少?如果不能,那么经费确定只能依据经验,缺乏科学决策基础。故而笔者认为,成本确定也应是抽样设计的一部分。

  假如调查的总费用C不是确定的,而是可变的,由式(1)可知,n[*,i]是关于C的函数,n[*,i]=f[,i](C);而最小抽样平均误差V[*]又是最优分配n[*,i]的函数,即:

  V[*]=g(n[*,1],n[*,2],…,n[*,k])

  =g[f[,1](C),f[,2](C),……,f[,k](C)]=h(C)

  可见给定不同的调查总成本,有不同的抽样最小平均误差。

  

  如上式,一旦调查总体确定,W[,i]、V[,i]、C[,i]都是常数,C[,0]也是定值,故而分子是常数T,抽样最小平均误差V[*]与调查的可变成本C′之间成简单的反比关系。其导函数:

  

  表示抽样最小平均误差V[*]与调查可变成本C′的边际替代率。调查费用确定的依据在于边际效率递减规律,成本的追加带来的抽样精度提高是递减的。

  二、多目标条件下成本与误差之间的函数关系

  对单目标决策而言,上文讨论的成本与误差之间的替代率可以作为决策的一种参考。但现实工作中往往遇到的情况是:总额有限的调查经费用于多个项目的调查。这时,式(2)为经费和样本容量在各项目间合理分配提供了依据。以下分两种情况讨论:

  1.不同抽样调查项目的抽样总体不一致,同样的总调查经费应如何统筹安排,才能使总的抽样调查误差最低。例如,组织一次农村抽样调查,分平原、丘陵、山区三个层次,要求调查的内容有:粮食亩产量、农户年纯收入、乡镇企业增加值。则须把田块、农户、企业三个抽样总体分别分层,用统一调拨的总经费C开展这三项调查。

  设共有s个调查项目,用P[,t]代表该项方差对总方差的权重,该权数根据各项调查的等级、期限及其它要求来制定,V[,t]代表各个调查项目的最小可能误差(t=1,2,…,s),按照式(2),V[,t]是分配给该项目的经费C[,t](可变成本)的函数,V[,t]=j(C[,t]),各项目总的方差V则是各项调查误差的综合值,由于各项方差不可直接比较,总的方差V实际上是各项目变异系数的加权和,最后转化为各项目可变成本的函数,V=h(C[,2],C[,2],…,C[,s])。欲使V最小,必须考虑的约束条件有两类:

  (1)各项成本之和等于总成本,称成本约束;

  (2)在满足总的方差最小时同时,要保证每个单项调查的方差V[,t]是可接受的,即小于可接受方差上限Vat,称单项误差约束,若首先只考虑成本约束,可引入条件极值:

  

  引入拉格朗日方法,设

  

  然后逐一检查各单项方差是否在可接受域内,作出降低精度要求或追加调查经费的决策。

  如果同时考虑两项约束,则可以引入非线性规划:

  

  其中单项误差约束的不等式右端数值是从左端推导出来的,没有采用C′,目的是为了尽可能收缩可行解域的范围。这类非线性规划没有解析解形式,但有较成熟的算法,如使用K-T条件[2]或栅格法[3]并运用计算机求解。如果有最优解,表明使用给定的成本C可以得到符合误差范围的经费分配方案(C[,1],C[,2],…,C[,s]),然后再按式(1)便可以得到每个项目的最优样本分配方案(n[*,1],n[*,2],…,n[*,k]),此时可以考虑采用该方案或适当减少经费。若无解,则必须追加经费或降低要求精度。

  2.不同抽样调查项目的抽样总体一致,但样本分配只能有一种,也就是说对同一总体的同一分层,不同的项目具有不同的层内方差结构,如何综合协调呢?对于不同层内方差,用V[,ti]表示第i层对于第t个调查项目所具有的层内方差。而每一组层内方差,都对应于一个最优样本分配方案,故而三个项目有三个方案,需要统筹规划。例如:调查平原、丘陵、山区各层次一定的样本田块,调查目的是了解平均亩产、平均每亩化肥投入和平均每亩农药投入等。

  对于平均亩产,存在层内方差:V[,11]V[,12]V[,13];

  对于平均化肥投入,存在层内方差:V[,21]V[,22]V[,23];

  对于平均农药投入,存在层内方差:V[,31]V[,32]V[,33]。

  

  故可以把表示为n[,1],n[,2],…,n[,k]的函数,其中T[,i]为常数。

  为了使 (n[,i])最小,必须考虑的两类约束条件同样是:(1)各项成本之和等于总成本,称成本约束;(2)该样本分配方案应保证每个单项调查的方差V[,t]是可接受的,即小于可接受方差上限V[,at],称单项误差约束。

  如果首先只考虑第一项成本约束,则可以引入条件极值:

  

  采用拉格朗日方法,设辅助函数:

  

  如果同时考虑两项约束,则可以引入非线性规划:

  

  该规划的解法与意义同前一规划近似,这里不再赘述。

  三、实例分析

  现有经费1万元用于两个项目的调查,已知资料如下,根据要求进行类型抽样设计:

  

  两个项目的误差对总抽样平均误差的权重分别为4和6,按照式(2)有:

  对于项目一,最小抽样平均误差与调查成本之间的函数关系为:

  

  同理,对于项目二,有:

  

  综合考虑两项目时有:

  

  得到规划:

  1.57 0.57

  V[,min]=─────+───────

   C[,1] C[,2]

  

  引入K-T条件,有:

  L=1.57/C[,1]+0.57/C[,2]+t(C[,1]+C[,2]-1)

  +λ[,1](C[,1]-0.4)+λ[,2](0.7-C[,2])

  +γ[,1](C[,1]-0.3)+γ[,2](0.6-C[,2])

  判断可行解:

  (1) C[,1]=0.4,C[,2]=0.6,λ[,2]=γ[,1]=0;

  

  找到一组解

  

  (2)C[,1]=0.7,C[,2]=0.3,λ[,1]=γ[,2]=0;同理有:γ[,1]=0,t=6.3,λ[,2]=3.1,V[,min]2=4.143;

  (3)0.4

  

  在三个可行解中,最优解是V[*]=min{V[,min]1,V[,min]2,V[,min]3}=V[,min]3,所以最优成本分配为:C[,1]=6241元,C[,2]=3759元;

  引入式(2),各项目的抽样平均误差为:V[,1]=29.2(公斤),V[,2]=351(元);

  引入式(1),各项目的最优样本分配为:(62,24,12)和(62,21,4)。

作者:彭念一陈曜

《统计研究》 2001年03期

  在社会经济研究中,由于实际条件的限制,往往采用抽样调查的方法获得现象总体的信息,当总体内部差异比较大时,应首先对总体各单位按有关标志加以分层,然后再从各层中按随机原则抽选一定单位构成样本。分层可以大大提高抽样推断的精度,降低工作量和成本,所以实际工作中分层抽样得到了最为广泛的应用。

  样本分配是分层抽样研究的一个重要方面。影响样本分配的因素主要有:各层方差、各层样本单位数、调查成本等,其中调查成本是与实际工作有密切影响的因素。当存在多个项目同时进行调查时,必须考虑综合成本最小化问题。本文即从理论上考查多项目场合中调查成本与调查精度之间的函数关系,为实际工作中的多目标决策提供思路。

  一、单目标条件下调查成本与抽样误差之间的函数关系

  设:全及总体分为k层;

  全及总体单位数为N,各层单位数为N[,i],(i=1,2,…,k);

  各层的层权为W[,i]=N[,i]/N,(i=1,2,…,k);

  总样本容量为n,从每个层内抽取的样本数记为n[,i],(i=1,2,…,k);

  

  从各层中抽取一样本单位的成本C[,i],(i=1,2,…,k);

  各层内方差为V[,i],标准差为σ[,i],(i=1,2,…,k);

  调查的总成本C=C(C[,0];C[,1];C[,2],…,C[,k];n[,1],n[,2],…,n[,k]),即:C′代表可变成本,即:

  

  其中C[,0]代表固定成本,它是指随被调查单位增多而增加的成本部分。

  按分层抽样规则,抽样平均误差是各层样本数目n[,i]的函数V=V(n[,1],n[,2],…,n[,k]),

  

  按最优分配法,当各层所分得样本容量为n[,1],n[,2],…,n[,k]时,对于给定的调查总费用C,令总的抽样平均误差达最小值V[*],求得:各层单位数最优分配如下(奈曼分配)[1]:

  

  注意一旦调查总体确定,W[,i]、V[,i]、C[,i]都是常数,同时C、C[,0]也是定值,所以n[*,1]、n[*,2],…,n[*,k]和V[*]都是唯一的,即最优解是唯一的。

  但是,调查经费是如何确定的呢?仅按照以上结论,有没有可能确定这笔调查经费的边际效率是多少?即在此基础上每追加单位经费,可以带来的误差降低量是多少?如果不能,那么经费确定只能依据经验,缺乏科学决策基础。故而笔者认为,成本确定也应是抽样设计的一部分。

  假如调查的总费用C不是确定的,而是可变的,由式(1)可知,n[*,i]是关于C的函数,n[*,i]=f[,i](C);而最小抽样平均误差V[*]又是最优分配n[*,i]的函数,即:

  V[*]=g(n[*,1],n[*,2],…,n[*,k])

  =g[f[,1](C),f[,2](C),……,f[,k](C)]=h(C)

  可见给定不同的调查总成本,有不同的抽样最小平均误差。

  

  如上式,一旦调查总体确定,W[,i]、V[,i]、C[,i]都是常数,C[,0]也是定值,故而分子是常数T,抽样最小平均误差V[*]与调查的可变成本C′之间成简单的反比关系。其导函数:

  

  表示抽样最小平均误差V[*]与调查可变成本C′的边际替代率。调查费用确定的依据在于边际效率递减规律,成本的追加带来的抽样精度提高是递减的。

  二、多目标条件下成本与误差之间的函数关系

  对单目标决策而言,上文讨论的成本与误差之间的替代率可以作为决策的一种参考。但现实工作中往往遇到的情况是:总额有限的调查经费用于多个项目的调查。这时,式(2)为经费和样本容量在各项目间合理分配提供了依据。以下分两种情况讨论:

  1.不同抽样调查项目的抽样总体不一致,同样的总调查经费应如何统筹安排,才能使总的抽样调查误差最低。例如,组织一次农村抽样调查,分平原、丘陵、山区三个层次,要求调查的内容有:粮食亩产量、农户年纯收入、乡镇企业增加值。则须把田块、农户、企业三个抽样总体分别分层,用统一调拨的总经费C开展这三项调查。

  设共有s个调查项目,用P[,t]代表该项方差对总方差的权重,该权数根据各项调查的等级、期限及其它要求来制定,V[,t]代表各个调查项目的最小可能误差(t=1,2,…,s),按照式(2),V[,t]是分配给该项目的经费C[,t](可变成本)的函数,V[,t]=j(C[,t]),各项目总的方差V则是各项调查误差的综合值,由于各项方差不可直接比较,总的方差V实际上是各项目变异系数的加权和,最后转化为各项目可变成本的函数,V=h(C[,2],C[,2],…,C[,s])。欲使V最小,必须考虑的约束条件有两类:

  (1)各项成本之和等于总成本,称成本约束;

  (2)在满足总的方差最小时同时,要保证每个单项调查的方差V[,t]是可接受的,即小于可接受方差上限Vat,称单项误差约束,若首先只考虑成本约束,可引入条件极值:

  

  引入拉格朗日方法,设

  

  然后逐一检查各单项方差是否在可接受域内,作出降低精度要求或追加调查经费的决策。

  如果同时考虑两项约束,则可以引入非线性规划:

  

  其中单项误差约束的不等式右端数值是从左端推导出来的,没有采用C′,目的是为了尽可能收缩可行解域的范围。这类非线性规划没有解析解形式,但有较成熟的算法,如使用K-T条件[2]或栅格法[3]并运用计算机求解。如果有最优解,表明使用给定的成本C可以得到符合误差范围的经费分配方案(C[,1],C[,2],…,C[,s]),然后再按式(1)便可以得到每个项目的最优样本分配方案(n[*,1],n[*,2],…,n[*,k]),此时可以考虑采用该方案或适当减少经费。若无解,则必须追加经费或降低要求精度。

  2.不同抽样调查项目的抽样总体一致,但样本分配只能有一种,也就是说对同一总体的同一分层,不同的项目具有不同的层内方差结构,如何综合协调呢?对于不同层内方差,用V[,ti]表示第i层对于第t个调查项目所具有的层内方差。而每一组层内方差,都对应于一个最优样本分配方案,故而三个项目有三个方案,需要统筹规划。例如:调查平原、丘陵、山区各层次一定的样本田块,调查目的是了解平均亩产、平均每亩化肥投入和平均每亩农药投入等。

  对于平均亩产,存在层内方差:V[,11]V[,12]V[,13];

  对于平均化肥投入,存在层内方差:V[,21]V[,22]V[,23];

  对于平均农药投入,存在层内方差:V[,31]V[,32]V[,33]。

  

  故可以把表示为n[,1],n[,2],…,n[,k]的函数,其中T[,i]为常数。

  为了使 (n[,i])最小,必须考虑的两类约束条件同样是:(1)各项成本之和等于总成本,称成本约束;(2)该样本分配方案应保证每个单项调查的方差V[,t]是可接受的,即小于可接受方差上限V[,at],称单项误差约束。

  如果首先只考虑第一项成本约束,则可以引入条件极值:

  

  采用拉格朗日方法,设辅助函数:

  

  如果同时考虑两项约束,则可以引入非线性规划:

  

  该规划的解法与意义同前一规划近似,这里不再赘述。

  三、实例分析

  现有经费1万元用于两个项目的调查,已知资料如下,根据要求进行类型抽样设计:

  

  两个项目的误差对总抽样平均误差的权重分别为4和6,按照式(2)有:

  对于项目一,最小抽样平均误差与调查成本之间的函数关系为:

  

  同理,对于项目二,有:

  

  综合考虑两项目时有:

  

  得到规划:

  1.57 0.57

  V[,min]=─────+───────

   C[,1] C[,2]

  

  引入K-T条件,有:

  L=1.57/C[,1]+0.57/C[,2]+t(C[,1]+C[,2]-1)

  +λ[,1](C[,1]-0.4)+λ[,2](0.7-C[,2])

  +γ[,1](C[,1]-0.3)+γ[,2](0.6-C[,2])

  判断可行解:

  (1) C[,1]=0.4,C[,2]=0.6,λ[,2]=γ[,1]=0;

  

  找到一组解

  

  (2)C[,1]=0.7,C[,2]=0.3,λ[,1]=γ[,2]=0;同理有:γ[,1]=0,t=6.3,λ[,2]=3.1,V[,min]2=4.143;

  (3)0.4

  

  在三个可行解中,最优解是V[*]=min{V[,min]1,V[,min]2,V[,min]3}=V[,min]3,所以最优成本分配为:C[,1]=6241元,C[,2]=3759元;

  引入式(2),各项目的抽样平均误差为:V[,1]=29.2(公斤),V[,2]=351(元);

  引入式(1),各项目的最优样本分配为:(62,24,12)和(62,21,4)。


相关文章

  • 检验员培训材料
  • 检验员培训材料 第一部分 产品检验工作的基本要求 产品质量是企业的生命,是企业在竞争中取胜从而求得自身发展的根本保证.我们从事检验工作,为了保证产品质量,首先必须对产品和质量有一定的认识,同时了解检验工作的基本要求,才能做好检验工作. 第一 ...查看


  • 抽样技术练习题及答案
  • 1. 请列举一些你所了解的以及被接受的抽样调查. 2.抽样调查基础理论及其意义: 3. 抽样调查的特点. 4.样本可能数目及其意义: 5.影响抽样误差的因素: 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 6 ...查看


  • 食品质量管理考试必备~你懂的
  • 产品质量:是之产品能够满足使用要求所具备的特性.一般包括性能.寿命.可靠性.安全性.经济型以及外观质量.质量职能:是对企业为保证产品质量而进行的全部技术.生产和管理活动的总成,是产品质量生产.形成和实现过程中企业各部门应发挥的作用应承担的任 ...查看


  • 抽样技术与应用期末复习题
  • 一.选择题 1.分层抽样的特点是() A.层内差异小,层间差异大 B.层间差异小,层内差异大 C.层间差异小 D.层内差异大 2.下面的表达式中错误的是() A.∑fh=1 B.∑nh=n C.∑Wh=1 D.∑Nh=1 3.各省电脑体育彩 ...查看


  • 质量管理07~_08试卷(A)及答案
  • 中国计量学院200 7 ~ 200 8 学年第 二 学期 < 质量管理 >课程考试试卷(A ) 一.选择题(20×1分=20分). 1.提出质量就是适用性观点的是美国质量管理专家( ). A .田口玄一 B .石川馨 C .克劳 ...查看


  • 彭浪老师主讲-创造价值的质量管理
  • 彭浪<创造价值的质量管理>课纲 [课程定位] 质量是企业的生命,质量管理要真正成为保证企业长盛不衰的工具,必须跨过三个门槛:第一,质量部门要确定企业公认的并且正确的规范.标准:第二,质量人员对规范和标准能够准确无误地判断,保证公 ...查看


  • 2013初级质量工程师模拟试题及答案[1]
  • 2013初级质量工程师模拟试题及答案 一.单项选择题 1.如果可感知效果与期望相匹配,期望得到满足,顾客就(A). A.满意 B.抱怨 C.忠诚 D.不满意 2.顾客满意度是对顾客满意的(A)描述. A.定量化 B.定性化 C.感受化 D. ...查看


  • 注会审计知识点:审计抽样基本理论知识
  • 注会审计知识点:审计抽样基本理论知识 审计抽样基本理论知识: 1. 审计抽样的适用的范围 (1)风险评估程序.风险评估程序通常不涉及审计抽样. (2)控制测试: ①当控制的运行留下轨迹时,注册会计师可以考虑使用审计抽样实施控制测试: ②对于 ...查看


  • 市场调研方法
  • 市场调查有许多方法,企业市场调查人员可根据具体情况选择不同的方法.市场调 查方法可分为两大类,第一类按选择调查对象来划分,有全面普查.重点调查.随机 抽样.非随机抽样等:第二类是按调查对象所采用的具体方法来划分,有访问法.观 察法.实验法. ...查看


热门内容