第二章 统计数据的搜集与整理
第一节 数据的计量与类型
一、 数据的计量尺度
统计数据是对客观现象进行计量的结果。不同的十五计量和测度的程度是不
同。有些可以进行属性分类,有些则可以采用数字计量。不同的计量尺度,可以
得到不同类型的统计数据,使用与不同的统计分析方法。一般可采用的计量尺度
有以下四种:
(一)、 定类尺度
定类尺度也成列名尺度,他就是按照事物的某种属性进行平行的分类或分组。 丁类尺度只是册读了事物之间的类型差别,而事物之间的其他差别却无法表现。 对丁类尺度的脊梁解雇,可以计算每一类中个个体出现的聘书。
在使用定类尺度进行分类是必须符合穷尽和护持的要求。穷尽是指在所作的全部
分类中,必须保证每个个体都能归属于某一类别,不能遗漏。 类别护持是指每
一个体只能在一个类别中出现,而不能在其他类别中重复出现。
(二)、定序尺度
定序尺度有成顺序尺度,它是对事物之间登记差别和顺序差别的一种册度。这
种尺度不仅可以将事物分成不同的类别,还可以确定这些事物的优劣和顺序。也
就是说不仅可以册度类别差,还可以册度次序差。
定序尺度的计量结果虽然也表现为类别,但这些类别之间是可以比较顺序的。相比较而言,定序尺度对事物的计量必定类尺度要精确一些,计量的结果能比较
大小,但不能进行数学运算。
(三)、定距尺度
定距尺度也称间隔尺度。他不仅能够区分事务类型,并进行排序,而且可以
掷出类别之间的差距是多少。定距尺度斯对事物类别或次序之间艰巨的侧度,这
种尺度通常使用自然或无力单位作为剂量的标准。因此,定距尺度的计量结果表
现为数值。由于这类尺度的每一间隔都是相等的,只要给出一个度量单位,就可
以准确地指出两个技术之间的差值。因此,其计量结果可以进行加、减的数学运
算。
(四)、定比尺度
定比尺度也称比率尺度。他预订距尺度属于同一层次,他的计量结果也表现
为数值。它具有以上三种尺度的全部特性,另外还具有一个特性,就是可以计算
两个测读书之之间的比值。这要求定比尺度中必须有一个固定的“零点”,这是
它与定距尺度的差别。定距尺度中的“0”表示一个数值,即“0”水平。而并不
是表示没有。他是一个有意义的数值。但定比尺度则不同,“0“表示没有或不存
在。定比尺度可以进行加、减、乘、除等的数学运算。
上述四种计量尺度对事物的计量是逐步递进的。四种计量尺度的比较如下:
教材 9 页, 表2——1的内容。
在统计分析中,一般情况下,要求测量的层次越高越好,因为高层次的计量
尺度包含有更多的数学特性,运用的统计方法越多,分析越方便。
二、 数据的类型
统计数据是采用某种计量尺度对事物进行剂量的结果。采用不同的计量尺度会
得到不同类型的统计数据。根据剂量的结果来看,统计数据大体可以分为两种类
型,既定性数据和定量数据。
定性数据也称品质数据,是用来说明事物性质特征的,是不能用数值表示的。
这类数据是顶类尺度和定序尺度的计量所形成的。
定量数据也叫数量数据。他是说明事物数量特征的,是可以用具体数值表示的,
这类数据是由定距尺度和定比尺度计量所形成的。对不同类型的统计数据可以采
用不同的统计方法进行处理和分析。
我们知道,用来说明现象属性或特征的概念名城成为变量,变量的具体表现成
为变量值,统计数据就是统计变量的具体表现内容。如果由品质数据表现的脚品
质变量。由数量数据记录的脚数量变量。
三、统计数据的表现形式
数量型的统计数据通常有两种基本的表现形式:即绝对数和相对数。
绝对数是统计数据最基本的表现形式,又称为总量指标。表现现象总体规模和
总体水平的数据都是以绝对数的形式来体现。
1、总量指标按其反映的时间状况不同,可分为时期指标和时点指标。
时期指标,是反映现象在一定时期内发展过程的总量。如产品产量、产值、
商品流转额、人口出生数等。时期指标具有以下特点:
(1)时期指标各时期的数值可以直接相加,其和说明较长时间内社会经济现
象发生的总量。
(2)时期指标的数值大小与时期的长短有直接关系,如一年的商品销售额一
定大于一个月的商品销售额。
(3)时期指标的数值是通过连续登记取得的。
时点指标,是反映现象在某一时刻(瞬间)上状况的总量。如人口数、企业数、
生猪存栏头数、固定资产净值、机器台数,商品库存额等。时点指标具有以下特
点:
(1)不同时点上的时点指标数值不具可加性。不同时点上的时点数值直接相
加,除在有关指标的计算过程中需要外,没有实际意义。
(2)时点指标数值大小与时点间隔没有直接关系。如年末的商品库存额不一
定比某月月末的库存额大。
(3)时点指标的数值一般是通过间断登记取得的。
2、统计数据都有一定的计量单位,不同的计量单位表现不同统计数据,绝
对数按其采用的计量单位不同,可以分为实物量指标、价值量指标和劳动量指标。
实物量指标:就是以实物单位计量的总量指标,如人口总数、职工人数、粮
食产量、钢铁产量、煤炭产量、设备台数等。实物量指标的优点是能直接反映产
品的使用价值的大小;其缺点是指标的综合性能较差。
价值量指标:是以货币单位计量的总量指标,如国民生产总值、国民收入、
固定资产投资额、社会商品零售额等。价值量指标的优点是具有广泛的综合性能
和概括能力;其缺点是指标比较抽象、脱离物质内容。所以分析问题时总是实物
量指标与价值量指标结合应用。
劳动量指标:是以劳动单位计量的总量指标,如出勤工时、缺勤工时、生产
实用工时等。
另外,还有一种复合单位剂量的统计数据,如:货物的周转量以吨公里表示
等。
相对数,是社会经济现象中两个有联系的指标数值之比。其中作为比较
基础的量称为基数,作为进行比较的量称为对比数,即
相对数对比数
基数
相对指标有以下两个特点:第一,它是一种抽象化了的数值,反映现象之间
差别的相对程度;第二,其数值大小不随总体范围的大小而变化。
百分数和千分数是相对数的基本表现形式,就是将对比基数定为100或
1000而计算出来的相对数,分别用%和‟表示。其中百分数是计算相对指标数
值时最常用的一种形式,如计划完成程度、发展速度、增长速度都是用百分数表
示的。当对比的分子数值比分母数值小很多时,宜用千分数表示,如人口出生率、
人口死亡率、人口自然增长率等。
第二节 统计数据的搜集
党通缉的研究工作开始时,首先明确研究为题的目的和所需的资料,然后要
考虑如何收集到这些资料。一是可以利用现成的资料,如公报,年检、数据库提
供的资料等。另一方面是指接收机,即通过调查的方式取得。调查方式得到资料,
可以采用实验式取得, 例如泰勒的科学管理理论中的工作定额远原理。也可以
采用非实验室的,直接观察取得统计资料。
一、 统计数据的直接来源
统计数据的直接来源有两个渠道,一是专门组织调查;二是科学的试验。专
门组织的调查市区的社会经济数据的主要方式,而科学实验室取得自然科学研究
数据的主要渠道。我们在这里主要讨论取得社会经济数据的方式。
统计调查搜集的统计资料有两种:一种是对原始资料的搜集。所谓原始
资料,是指直接向调查单位搜集的,尚待进一步汇总整理,需要从个体过渡到总
体的统计资料。如居民收支状况调查中直接对每个居民收支情况的调查。另一种
是对次级资料的搜集。所谓次级资料,是指已经经过加工整理,由个体过渡到总
体,能在一定程度上说明整体现象的统计资料。但是次级资料都是通过对原始资
料的加工,从原始资料过渡而来的,所以,这些统计资料都来源于原始资料。统
计调查的根本目的就是搜集到丰富的,能够反映社会经济总体现象及其各部分间
相互联系的原始统计资料。
统计调查是统计工作的重要环节,是整个统计工作的基础。在整个统计工作
过程中,它担负着提供基础资料的作用。只有准确及时地搜集到内容丰富合乎客
观实际的统计资料,才能经过统计整理、统计分析等一系列统计处理方法,使统
计研究得出正确的结论。为经济管理和经济决策部门提供可靠的信息,更好地发
挥统计信息、统计咨询和统计监督的职能。
(一)、统计调查方式
统计调查时统计数据的主要来源。在我国,统计调查的组织形式有统计
报表、普查、抽样调查、重点调查、典型调查等。1992年,我国的国家统计系
统已将抽样调查定为统计调查的主体,将周期性的普查作为基础。同时辅之以统
计报表、重点调查和典型调查等组织形式。
1、 普查
普查是一种专门组织的、一次性的全面调查。它主要用来搜集某些不能够
或不适宜于用定期的全面统计报表搜集的统计资料,以搞清重要的国情、国力,
一般用来调查属于某一时点上的社会经济现象的总量,但也可以用来反映时期
现象。
普查是一种很重要的调查方式。通过统计报表,虽然可以搜集全面的基本统
计资料,但它不能代替普查。因为有些社会经济现象,如人口增长及其构成变化、
耕地面积、工业设备等情况不可能也不需要组织经常性的全面调查而国家又必须
掌握这些方面比较全面详细的资料,这就需要通过普查来解决。为了搞清某些有
关国情、国力的重要数字,要分期分批地进行专项普查。如我国于1990年进行
的第四次全国人口普查、1993年进行的第三产业普查、1995年进行的工业普查、
1997年进行的农业普查等。
普查作为一种特殊的统计调查方式,具有以下特点:
第一、具有周期性。因为普查主要调查一定十点上的统计资料,普查可以根据学要临时进行,
也可以按一定的周期进行。目前,我国的普查基本都是周期性的,从2000年起,我国的周期性普查主要包括:人口普查、农业普查和经济普查。人口普查和农业普查每十年一次,分别在0年、6年分别进行;将工业普查、第三产业普查和基本单位普查合并为经济普查,每十年进行两次。
第二 、普查需要规定统一的标准时间:所谓标准时点是指对被调查对象登
记时所依据的统一时点,这个标准时点一经确定所有调查资料都要反映这一时点
上的状况。如我国第四次人口普查反映的就是1990年7月1日零时我国人口的
实际状况。规定标准时间是为了避免搜集资料时由于自然变动或机械变动而产生
的重复或遗漏。这是因为普查是反映现象在某一时点上的情况,为了避免调查资
料的重复登记和遗漏,需要同一时间。
第二、普查的数据规范程度比较高。普查是专门组织的全面调查,可以为抽样调查提供基础
性的数据。
第三、 普查的使用领域是有限的。由于普查动用的热力、物力较多,资金耗费很大,目前
普查仅限于对重要的国情国力数据的收集调查。
各种组织形式的普查工作,由于调查规模大,涉及面广,必须通盘考虑进行
普查的全过程,充分做好普查的组织和准备工作:①建立健全统一的普查领导机
构,并对群众进行广泛的宣传和动员。②设计普查方案,应根据具体目的确定普
查对象和单位、普查项目、普查时间、汇总方案等。③训练普查人员。④组织试
点,总结经验,借以修订普查办法和工作细则,有时还应制订阶段工作进程图,
编制从登记、复查、编码、数据录入直到分析的各个环节工作流程图。试点的过
程也是修改和完善普查方案并从中培训干部的过程,为由点到面开展普查工作奠
定可靠的基础。⑤物质准备,主要包括汇总工具,印发普查文件和经费预算等。
准备工作为普查的全面展开提供了条件。接着进行正式调查登记,将调查资
料及时报送受报机关;汇总分析普查资料报送有关部门;公布资料,总结普查工
作。
2、 抽样调查
抽样调查实施集中应用最广泛的一种调查方法。抽样调查是按随机原则从调查对象中抽取部分单位作为样本,并根据样本资料对总体的数量特征作出科学的估计或推断的一种非全面调查方法。抽样调查是非全面调查,但它的目的却在于取得反映全面情况的统计资料,在一定意义上可以起到全面调查的作用。抽样调查是非全面调查中最完善,最有科学根据的方式方法。
抽样调查有如下几方面的特点:
第一、经济性。
第二、时效性高。
第三、适应范围比较广。
第四、准确性高。
3、统计报表
统计报表是按照国家统一规定的表格形式,统一规定的指标内容,统一的报送程序和报送时间,自上而下统一布置,自下而上地逐级提供基本统计资料的一种报表制度。国家利用它定期地取得全社会的经济和社会发展的基本统计资料。执行统计报表制度,是各地区、各部门、各基层单位必须向国家履行的一种义务。
1.统计报表的特点和优点
(1)统计报表的指标内容、口径范围、计算方法、报送程序和报送时间都是由国家统一规定的,这就保证了搜集资料统一性和有效性。
(2)各级领导部门可以通过统计报表,经常全面了解经济和社会发展变化情况,我国运用的大多数统计报表是全面统计报表,具有全面性。
(3)在调查进行前把报表布置到基层填报单位,以便他们根据报表的要求,及时建立健全各种原始记录,使统计报表的资料来源建立在可靠的基础上,做到资料准确,报送及时。
(4)统计报表是定期地连续观察登记的,因而便于完整地积累资料,系统地分析经济和社会发展变化的规律性。
2.统计报表的种类
(1)按调查范围不同分为全面统计报表和非全面统计报表。全面统计报表要求调查对象中每一个单位都填报。目前,我国采用的统计报表绝大多数都是全面的统计报表。非全面统计报表只要求调查单位中的一部分单位填报。它要结合重点调查、典型调查和抽样调查来运用,如工业主要技术经济指标就采用重点调查方式,农村经济调查就用过抽样调查或典型调查选出调查单位的办法,将统计报表布置给基层填报。
(2)按报送周期长短不同,分为日报、旬报、月报、季报、半年报和年报等。报送周期逾短花费的人力、物力、财力愈多,因此,报送周期短的,指标项目应该少一些,粗一些,时效性要强一些。报送周期长的,指标项目可以多一些,细一些,内容也要更详尽些。一般情况下,日报和旬报只能限于填报生产中最主要指标,凡是年报、半年报能满足需要的,就不要用季报、月报;季报、月报能满足需要的,就不要用旬报、日报。
(3)按报送的单位不同分为基层报表和综合报表两种。基层报表是指由基层企事业单位填制的报表,综合报表是由主管部门或统计部门根据基层报表逐级汇总填制的报表。
(4)按报表内容和实施范围不同,分为国家统计报表、部门统计报表和地方统计报表。国家统计报表是由国家统计部门统一制发,用来搜集工业、农业、交
通运输、基本建设、商业、劳动、物资、科研等方面最基本的统计资料。部门统计报表是根据有关的部门统计调查项目和统计调查计划相应制订的统计报表,一般用来搜集各级主管部门所需的专业技术资料,在各该主管部门系统内施行。地方统计报表是根据有关的地方统计调查项目和统计调查计划相应制订的统计报表,用来满足地方的专门需要。部门和地方统计报表都是国家统计报表的补充。
(四)统计报表的资料来源
统计报表资料来源于基层单位的原始记录。从原始记录到统计报表,中间还要经过统计台帐和企业内部报表。因此,建立健全原始记录制度、统计台帐和企业内部的统计报表制度,是保证统计报表质量的基础。
1.原始记录。原始记录是基层单位通过一定的表格形式,对生产经营活动的过程和成果所作的第一手的数字或文字记载,是未经任何加工整理的初级资料。
原始记录的内容,要因各个基层单位不同情况而定,不求千篇一律。但总的来说,一套完整的原始记录,应包括以下内容:①记录项目和记录表格。将需要记录的具体内容表格化,使记录的各项内容体现在表格上。②负责记录的人员。对每个原始记录表格,要明确规定负责记录的人员。③各种原始记录表格每次记录的份数,传递的路线和报送的时间。
2.统计台帐。统计台帐是基层单位根据填报统计报表和本单位经营管理的需要而设置的一种系统积累统计资料的表册。统计台帐的基本形式,大体上有以下两种:①多指标的综合台帐,这种台帐是在一个表册上,按时间顺序,同时登记若干有关指标数值的发展变化情况。如企业或车间为检查各项主要指标完成情况而设置的主要指标完成情况台帐。②单指标分组台帐。这种台帐是在一个表册上,按时间顺序,同时登记各个下属单位某一指标数值的发展变化情况。
3.内部报表。基层单位的内部报表,大致有两类:一类是为向单位领导提供资料而编制的;一类是为填报上级规定的统计报表而布置的。这两类报表的内容有相同的地方,也有不同的地方。但都要求本单位内的各个有关科室、班组、车间或有关人员填报,按一定的传递程序,最后集中到主管统计工作的科室。由原始记录到统计台帐到统计报表的程序如下:
原始记录
↓
班组台帐→班组报表
↓
车间台帐→车间报表
↓
科室台帐→企业内部报表
↓—→国家统计报表
4、重点调查
重点调查是指在调查对象范围内,只选择一部分重点单位进行调查,借以了解总体基本情况的一种非全面调查。
所谓重点单位,是指在总体中举足轻重的那些单位。这些单位虽可能数目不
多,但就调查的标志值来说,它们在总体中却占有很大的比重,能反映出总体的基本情况。例如,要了解全国钢铁生产的基本情况,只要调查占全国钢产量比重很大的鞍钢、上钢、包钢、太钢、宝钢、首钢、武钢等几个钢铁企业就可以了。重点调查较之全面调查省时省力,而且能更加及时了解总体的基本情况。在调查对象中确实存在着重点单位,而且调查的任务只要求了解总体的基本情况而不是总体的准确数值时,进行重点调查是比较适宜的。它将是我国今后统计调查方法体系中一种重要的辅助方法。
重点调查可以是经常性调查,也可以是一次性调查。组织重点调查的首要问题是确定重点单位。对重点单位的选择应满足以下要求:
1.重点单位选多选少,要根据调查任务确定。一般说来,选出的单位应尽可能少些,而其标志值在总体中所占比重应尽可能大些。
2.选中的单位,管理应比较健全,统计力量应比较扎实,这样才能准确,及时的取得资料。
5、典型调查
典型调查就是根据调查的目的和要求,在对研究对象进行全面分析的基础上,有意识地选择部分有代表性的单位进行调查,以认识事物发展变化的规律性的一种非全面调查。
这种调查具有两个特征:第一,它是深入细致的调查。它的调查范围小调查单位少,因而指标可以多一些,用来研究某些比较复杂的专门问题。第二,调查单位是根据调查的目的和任务,在对调查总体进行全面分析的基础上,有意识地选择出来的。
典型调查是一种比较灵活的统计调查方法,它既可以注重于现象的量的方向和数量关系的分析,也可以从质的方面分析数量和数量关系形成的原因;可以是对某一问题纵向方面进行研究,深入少数单位了解问题的历史和现状,也可以是就某一问题从横向方面进行探讨,了解问题在不同条件下的不同表现。
典型调查有以下几方面的作用:
1.补充全面调查的不足。这可以从两方面来理解,一是对于不需要或不可能通过全面调查和其他非全面调查取得的统计资料,用典型调查来弥补。例如,为了研究粮、棉比价是否合理,不需要进行全面调查,只要运用典型调查方法,取得若干有代表性的国有农场和村民委员会的统计数字就解决问题了;二是对全面调查中发现的问题,可深入有关单位进行典型调查,弄清问题所在的实质原因。
2.在一定条件下,验证全面调查资料数字的真实性。例如,从全部基层单位填报的数字中抽出一部分基层单位的数字进行检查,看其是否有弄虚作假现象,从中发现一些规律性的东西。
3.可以研究新生事物,了解新情况,新问题。新生事物在开始时往往是少数,无法进行全面调查,只有运用典型调查方法,抓住典型把握事物发展方向,才能为正确处理问题提供依据。
6、各种调查方式的结合运用
(二)、统计数据的搜集方法
1、访问调查
2、邮寄调查
3、电话调查
4、座谈会
5、个别深度访问
(三)、调查方案设计
统计调查是一项复杂而又细致的工作,一个规模较大的统计调查项目往往需要动员成千上万人协同工作才能完成。为了在统计调查过程中统一认识,统一内容,统一方法,统一步调,顺利完成任务,在调查前必须有一个统一的统计调查方案。切实可行的统计调查方案是保证统计调查有计划,有组织地进行的首要步骤,是统计设计在调查阶段的具体化。
一个完整的调查方案,应包括以下几个方面的内容:
1、确定调查的目的
明确统计调查的目的和任务是制订统计调查方案的首要问题。对任何社会经济现象的研究,可以根据不同的目的,不同的任务从不同的角度去搜集资料。如对工业经济情况的研究可以从工业生产方面去研究,也可以从农工商的关系去研究,还可从工业产品成本,工业内部的结构等方面去研究。调查的目的和任务不同,调查的内容和范围也就不同。目的不明任务不清,就无法确定向谁调查,调查什么,以及用什么方式方法进行调查。这就会使调查工作带有很大的盲目性,调查到的资料可能是不需要的,需要了解的情况而又得不到充分的反映,这样不仅会造成人力、物力、财力的大量浪费,而且还会延误工作。
有明确确定统计调查的目的和任务,必须根据党的方针政策和当前形势出发,立足于统计工作的整体需要,抓住实际上最重要最急迫的问题,并要认真分析制订的计划和调查对象的实际情况,把需要与可能结合起来。
2、确定调查对象和调查单位
确定调查对象和调查单位是回答向谁调查和由谁来具体提供统计资料的问题。调查的任务和目的明确以后,就要确定调查对象和调查单位。调查对象就是需要调查的社会现象的总体,它是由性质上相同的许多调查单位所组成。调查单位就是构成社会现象总体的个体,是调查项目的具体承担者,也就是在调查对象中所要调查的具体单位。例如:调查目的是搜集全市小学状况的资料,那么,该市所有小学就是调查对象,而全市的每一所小学就是调查单位。又如,调查的目的是搜集国有工业企业的设备资料,则调查对象是一切国有工业企业的所有设备,而国有工业企业的每一台设备则是调查单位。
在统计调查阶段了规定调查单位外,还要规定填报单位。调查单位是调查项目的承担者,而填报单位则是负责向上报告调查内容的单位。调查单位和填报单位在多数调查中是一致的,如在上述第一个例子中,全市的每一所小学既是调查单位,又是填报单位。有时二者又不一致,如在上述第二例子中,工业企业中每台设备是调查单位,而填报单位则是指每个工业企业。确定调查对象使我们知道所要了解的总体界限,确定调查单位使我们知道从哪里去取得有关标志的具体资料,确定填报单位使我们知道由谁提供具体资料。
3、确定调查项目、设计调查表
调查内容是指所要调查的具体项目,在进行调查之前,必须根据调查的目的,明确规定统计的调查项目,一般说来,确定调查项目应注意以下几点:
第一,确定调查项目,要有取得资料的可能性。凡是列入调查表,确定为调
查内容的项目,必须能够取得确切的资料。否则,既使需要,但没有条件取得确切资料的项目,也不该列入。同时,对每一个调查项目都应该有确切的涵义和统一的解释,以免因为调查人员理解不同而致使调查结果不一致。
第二,被确定为调查内容的每个项目间,应该彼此衔接,以便对现象的相互联系从整体上了解,也便于有关项目相互核对,提高调查资料的质量。
第三,调查项目之间时间上要有可比性,即本次调查项目和过去同类调查项目之间要互相衔接,以便进行动态对比。
第四,能确定的项目必须与调查目的有关。只登记与问题有关的标志,不应包括可有可无备而不用的标志。
调查的内容明确以后,就要根据一定的目的,把拟确定的调查项目按照一定的顺序排列成表格的形式,这就是调查表。它包括需要向调查单位了解的有关品质标志,数量标志和其它情况。它是回答向有关单位调查什么的问题。
调查表是调查方案的核心部分。必须紧紧围绕调查目的,从现象间的相互联系,从现象的过去、现在和发展等方面出发,提出所要调查的项目,拟定调查表。
调查表的形式一般有单一表和一览表两种。单一表每份表上只登记一个调查单位,它可以容纳较多的调查项目,在整理和汇总时便于利用调查表按各种标志分组计算。如工业企业的产品产量,产品成本等定期报表都采用单一表形式。一览表是在一张调查表上登记若干个调查单位,它所容纳的调查项目要少一些,我国人口普查表一般是这种形式。一览表的好处是每个调查单位的共同事项只需登记一次,节省人力和时间,表中有关单位和资料可以相互核对检查。在统计调查表中采用哪种表格形式,一般可考虑以下两方面情况:第一,看调查项目的多少。在调查项目较多时,可采用单一表,调查项目不多时,可采用一览表。第二,看调查单位和报告单位是否一致,如果是一致时采用单一表,否则,可采用一览表。
调查表确定以后,需要编写填表说明和指标解释,这是为了保证调查资料的科学性和统一性必备的调查文件。
调查问卷是搜集资料的又一种形式和载体。调查问卷是调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种调查形式。不同的调查问卷在具体结构、题型、措辞、版式等设计上会有所不同,但在结构上一般都由以下几个部分组成:①开头部分。它一般包括问候语、填表说明和问卷编号等内容;②甄别部分。甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要的部分,然后针对特定的被调查者进行调查;③主体部分。该部分是调查问卷的核心内容,它包括了所要调查的全部问题,主要由问题和备选答案所组成;④背景部分。它通常放在问题的最后,主要是有关被调查者的一些背景资料。
在设计调查问卷时应注意:①对每个问题和答案的设计,应充分考虑到问题的统计方法;②问卷用语要准确、规范,注意被调查者的身份和思维习惯;③问卷格式要整齐,编码要规范;④问题应当短小,便于作明确的答复;⑤问题的排列应当具有逻辑性;⑥对敏感性问题设计问卷时应遵守保密的原则。
4、其他相关内容
调查的组织实施计划是调查工作顺利开展的重要保证,一个完整的组织实施计划应包括以下几方面的内容:
(一)确定调查时间
调查时间是指调查资料所属的时间。如果所要调查的是时期现象,就要明确该现象是从何年何月何日起到何年何月何日止。如果所调查的是时点现象,就要
明确规定统一的标准调查时点。
为了保证统计资料的及时性还必须规定调查期限。调查期限是指进行调查工作的时限,包括搜集资料和报送资料的整个工作所需的时间。规定调查期限要考虑调查项目的复杂性和调查资料的时效性。一般调查期限不宜过长。
(二)确定调查地点
调查地点是指登记调查资料的地点。通常,调查地点和调查单位所在地是一致的。但是在二者不一致的情况下必须明确规定调查的地点。如进行人口普查时,如果按“常住人口”登记,不论被调查者是否暂时外出居住,都应在每个居民的常住地点进行登记。
(三)做好严密细致的组织工作
这是统计调查顺利实施的保证。调查工作的组织主要应包括以下内容:调查工作的组织领导机构和调查人员的组织;调查的方式方法;调查前的准备工作,包括宣传教育,干部培训,文件印刷等;调查资料的报送办法;调查经费的来源,开支办法;提供或者公布调查成果的时间,等等。
制定一定规模的统计调查方案,还需要进行试点调查。通过试点,检验调查方案,积累组织实施的经验。
二、统计数据的间接来源
三、统计数据的误差
误差是指所收集的资料与实际之间的差距。产生误差的原因多种多样,大致有三类:抽样误差、调查误差和其他误差。
臭氧误差是抽样调查中存在的,是不可避免的,具体的计算在抽样推断章节中介绍。
调查误差是调查过程中产生的,原因是多方面的。如:对问题的理解、概念的错误、计量标准的错误等引起的误差。这类误差是调查过程中尽量可以避免或减少的误差。
其他误差不时发生在调查过程中的误差。如:记录、打印、抄写等产生的误差等。
第三节 统计数据的整理
当采用各种方式将统计数据搜集上来之后,就需要对统计数据进行加工整理,使之系统化,条理化。
一、数据整理的概念和内容
(一)、统计整理的概念
统计整理是根据统计研究的任务与要求,对统计调查所取得的各种原始资料进行科学的汇总和加工,使之系统化、条理化,从而得到反映总体特征的综合资料的工作过程。这项工作也包括系统地积累资料和为研究特定问题对资料的再加工。
(二)、 统计数据整理的意义
统计调查所取得的原始资料都是零星的、分散的、不系统的,仅能表明各个调查单位的具体情况,反映事物表象的一个侧面,不能说明被研究总体的全貌。因此,只有对这些资料进行科学地加工整理才能认识事物的本质,暴露事物的内部矛盾,得出正确的合乎事物发展规律与趋势的分析结果。
统计整理是统计工作的第三阶段,是统计调查的继续和统计分析的前提条件。它在整个统计工作中具有重要作用。统计资料整理的好,会使综合的资料十分完备和丰富;而不适当的加工整理,会使调查得来的大量原始资料失去价值和效用。所以,统计整理具有三个过渡作用,即由说明个体的材料过渡到说明总体的材料;由说明局部情况的材料过渡到说明全局的材料;由反映现象不系统不完备的材料过渡到反映现象系统的完备材料。
(三)统计数据整理的方法
统计数据整理的方法十分组、汇总和边表。
统计分组是统计数据整理的关键。汇 总是在统计分组的基础上,将各组的总体单位数汇总出来。编表是将汇总的结果通过一定的表格形式表现出来。
(四)、统计整理的步骤
1、数据的审核和筛选
2、数据的排序
3、数据的分组和汇总
4、频数分布
5、编制统计表格
二、 数据的审核与筛选
审核是统计资料整理加工中的首要环节,是对资料进行“深加工”的第一道工序。审核的内容主要包括以下几个方面:①准确性审核。准确性审核的内容包括两个方面:一是检查数据资料是否真实地反映了调查单位的客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确。审核资料准确性的方法主要有逻辑检查和技术检查。逻辑检查一般用来检查调查表中的内容是否合理、各调查项目所填数据或结果是否矛盾等;技术检查主要用于检查各类调查表及统计报表中的一些差错和问题的,如调查表的栏目有无错填、有无重复填报和缺填、数值的计量单位有无差错等。②及时性审核。主要是检查调查表或统计报表是否在规定的时间内报送,若没有按时报送,应催促其及时上交,并找出迟报的原因并商讨解决的办法。③完整性审核。主要是审核应调查的单位是否有遗漏,所有的调查项目或指标是否填写齐全。
三、 数据的排序
四、 统计分组
分类就是对资料按照某一标志或某几个标志进行分组,划分为若干部分。分类标志和分类方法的选择取决于分析研究的目的。
编码就是对需要整理加工的标志,按分类的先后顺序对每一种分类进行编码,根据这种编码,在每一份调查采集表格上的有关项目上标明所属分类的号码。这是为后面的汇总程序作准备,对保证整理加工的质量起到重要作用,便于我们进行汇总、核对和查找。
汇总根据汇总要求和工作条件选择适当的汇总组织形式和汇总的具体方法;按分组要求进行分组汇总,计算各组的单位数和合计总数,计算各组指标和综合指标。
(一)、统计分组的意义
根据统计研究的任务和对象特点,将统计总体的各个单位按照一定的标志区分为若干个组成部分的一种统计方法。虽然社会现象复杂多样,但现象之间常常既有某种共同的性质,又在质与量方面存在着种种差异。因此,只有通过科学而合理的统计分组,才能揭示现象内部各部分之间存在的客观差异,表明事物的本质和规律。统计分组具有两方面的含义:从总体角度看,它是“分”的过程,是把总体中的大量个体分成一个个性质不同的、范围更小的总体;从个体角度看,它又是“合”的过程,是把总体中有共同特征的单位集合起来成为一组。
(二)、统计分组的种类
1、按任务和作用的不同分组
分为类型分组,结构分组和分析分组。类型分组的目的是划分现象的经济类型;结构分组的目的是研究现象总体的内部构成;分析分组的目的是研究现象总体内部的依存关系。
2、安分组的标志多少分组
分为:
简单分组,就是总体按一个标志分组。
符合分组就是总体按两个获两个以上的标志重叠起来进行的分组。
3、安分组标志的性质分组
可以分为品质分组和变量分组。
(三)、分组体系和分组标志的选择
1、分组体系
任何统计总体都是由多个方面构成的有机整体,要全面认识总体的特征,就需要运用多个标志进行多次分组。将一系列相互联系的统计分组有机地结合在一起而形成的分组整体,就是统计分组体系。统计分组体系有两种不同的形式。
(1 )、平行分组体系(简单分组体系)
如果总体按照一个标志进行分组就称为简单分组。对同一总体选择两个或两个以上的标志分别简单分组就称为平行分组体系。例如,人口总体按性别、文化程度、婚姻状况等标志进行的分组,就是一个平行分组体系:
男性人口 (1
女性人口
文盲、半文盲人口
受过小学教育的人口
(2 受过初中教育的人口
受过高中教育的人口
受过大学教育的人口
(2)、复合分组体系
对同一总体选择两个或两个以上标志层叠(或交叉)起来分组,称为复合分组,复合分组本身构成复合分组体系。如对高等学校在校生可先按学科分组,然后对第一层次所分的各个组,再按性别分组,即构成复合分组体系:
理科学生组
男生组
女生组
文科学生组
男生组
女生组
工科学生组
男生组
女生组
在进行复合分组时,应先根据研究目的,确定主辅分组标志,先按主要标志对总体进行第一层次分组,然后再按辅助标志对第一层次所分的各组进行第二层次的划分。
2、分组标志的选择
统计分组的关键问题是选择分组标志与划分各组的界限,它不仅直接影响分组的科学性与统计资料整理的准确性,而且最终影响统计分析结果的真实性与可靠性。
正确地选择分组标志,是统计分组的核心问题。正确选择分组标志应遵循以下基本原则:
(1)、.要根据统计研究的目的与任务选择分组标志。由于统计研究的任何一个总体,都有许多标志。所以正确合理选择分组标志,就显得特别重要。例如,工业企业这个总体就有职工人数、产量、固定资金、流动资金、利税额等多种标志。在研究工业企业问题时,究竟选用哪个标志作分组的依据呢?一要看研究的是什么问题,二是在许多标志中,要抓住具有本质性的或主要的标志作为分组的依据。例如,在研究工业企业的经济效益时,一般要选择利税额标志分组,而不宜选择产量标志分组,因为产量高低不能说明经济效益的好坏。总之,在选择分组标志时,要注意避免选用一些形式的、不触及问题实质的标志。
(2)、.要根据现象所处的历史条件及经济条件选择分组标志。人类在不断进步,社会在不断发展,标志的选择随历史条件和经济条件的变化而变化。例如,在研究工业企业规模时,职工人数、产值、固定资产价值等都可以作为分组的标志。究竟选用哪一种标志呢?这就要看具体条件。在技术不发达的条件下,用职工人数的多少来表示企业规模的大小就比较恰当,而在技术进步的条件下,采用固定资产价值标志就会更切合实际。即使在同一历史条件下,在不同的经济部门或生产部门中,由于它们的经济条件不同,也必须分别对待。例如,在当今时代条件下,对劳动密集型、技术密集型、资金密集型的企业,就不能选用同一个标志来表示其规模的大小。显然,对劳动密集型企业,选用职工人数表示其规模就会合适些,对后者则选用固定资产价值标志更合适些。
(四) \ 统计分组的方法
1 \ 品质标志分组方法
品质分组一般比较简单. 按品质标志分组形成的分布数列称品质数列。例如,1998年底我国的从业人员人数按三次产业标志分组,可编制如下品质数列:
表3-9 1998年底我国从业人员人数的构成情况
各组名称 次数 频率
这个品质数列可以说明1998年底我国从业人员的构成情况及特点。
所有的品质数列,都是由两个基本要素构成:组的名称和各组的单位数(又称次数或频数)。如将各组单位数计算成比重则称频率。
2\ 数量标志分组方法
按数量标志分组形成的分布数列,称作变量数列。如将某班学生《统计学》课程考试情况按考分这个数量标志分组,即得到变量数列,如表3-10所示:
各组变量值 次数 频率
这个变量数列可以反映出该班学生《统计学》考试成绩的构成情况。
从表3-10所示,变量数列也有两个密不可分的要素组成,即各组变量值和各组单位数。
(1 )\ 单项式分组
单项式数列是以每一个变量值作为一个组而形成的分布数列。它一般是在分组的数量标志为离散性变量且变量的变异幅度较小的情况下编制的。
例如:
上例表明,工人生产的产品少者是7件,多者是10件,变量的变异幅度不大,组数也不太多,只有四组,这种变量数列,就是单项式变量数列。
(2 )\ 组距式数列
组距数列是由表示变量变动的一定范围或一定距离的两个变量值作为一个组而形成的分布数列。组距数列适用于按连续性变量分组或变量的变动范围较大的离散性变量分组的情况。如表3-12所示:
在组距数列中:每个组两端的数值称为组限,它分为上限和下限两种。每组的起点标志值叫做下限,如表3-12中的450、500、550、600、650、700分别为第一组至第六组的下限;每组的终点标志值叫做上限,如表3-12中的500、550、600、650、700、750分别为第一组至第六组的上限。
(3 )\ 等距和不等距.
每组的上限数值与下限数值之差叫做组距。
组距数列按其各组的组距是否相等,可以分为等距数列和异距数列。数列中每组的组距都相等叫做等距数列。如表3-12就是等距数列。数列中每组的组距并不都相等叫做异距数列。如表3-13所示:
研究的目的,一般当客观现象性质差异的变动比较均衡时,宜采用等距数列,而当客观现象性质差异的变动不均衡时,则宜采用异距数列。
编制组距数列中,特别需注意处理好以下几个问题。
1\. 确定变量的类型。一般地说,如果离散性变量的变异幅度较小,应把每个变量值列为一组,编制单项式变量数列,如果变量的变异幅度大,就应编制组距数列;对于连续性变量不能编制单项式的变量数列,只能编制组距数列。
2\ .确定组距与组数。在编制变量数列时,对全体变量值划分的部分数,就是组数,组数的多少和组距的大小互相制约,互相影响,二者成反比关系。确定组距与组数的基本原则是,要符合现象的实际情况,能够把总体次数分布的特点充分显示出来,对于是先确定组距还是先确定组数的问题应具体问题具体分析,灵活处理,一般来讲应先确定组距,组距确定以后,组数也就出来了。在等距数列情况下,组数等于全距除以组距。
3.\ 确定组限和组中值。在统计工作中,正确地划定组限,主要根据统计认识的目的和遵守组限能反映事物性质或特征的数量界限原则。
组限的确定,还要考虑作为分组标志的变量的类型,通常用连续型变量进行分组时,相邻两组交界处的组限应该重合,现举例说明如下:
邻两组的下限与上限不重合,势必形成空隙,使处在空隙中的变量值无法分组。用离散性变量进行分组,相邻两组的下限与上限不应重合,如:
即相邻两组交界处的组限可以重合。
综上所述,不论是利用连续性变量或是离散性变量分组,所编制的组距数列,都需出现组限重合的问题,在这种情况下对那些分组标志值重合的总体单位数,分到哪一组呢?一般应遵循“上限不在内”的原则,例如,在表3-14中年收入是1500元的农民数应统计到第三组中去,年收入2000元的农民数应统计到第四组中去。
在编制组距数列时,还应明确什么是开口组、闭口组、什么是组中值。开口组是只有上限缺下限,或只有下限缺上限的组;闭口组指下限与上限都齐全的组;组中值是上限与下限之间的中点数值,在统计实践中,需用组中值来代表组的一般水平。其计算公式如下:
组中值上限下限
开口组的组中值确定,一般是以其邻组组距为准:
缺上限的开口组组中值下限邻组组距
缺下限的开口组组中值上限邻组组距
五 、 频数分布
(一)\ 分配数列的概念\构成要素
分布数列是将统计总体按某一标志分组后,用来反映总体单位在各组中分布状况的统计数列。分布数列主要用来研究总体各单位的分布状况和总体的构成,并据以研究总体某一标志的平均水平及其变动的规律性。
分配数列有两个构成要素: 总体的分组和各族对应的单位数.
(二)\ 分配数列的类型
(三)\ 频数和频率
频数是分布在各组中的总体单位数。如果用相对数形式表示,便是比重(或称频率)。各组次数或比重的大小,意味着相应的变量值在决定总体数量表现中所起的作用不同。次数或比重大的组,其变量值在决定总体数量表现中的作用就大,反之就小。由于社会经济现象性质的不同,各种统计总体都有不同的次数分布,形成各种不同类型的分布特征。通过次数的分布特征,可以研究大量社会经济现象的统计规律性。
(四)\ 次数分布的类型和表示方法
1\ 分布的类型
各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有钟型分布,U型分布,J型分布。
1.钟型分布。当次数分布出现两端次数较少,靠近中间次数较多的状态时,所绘制的曲线图,就象一口古钟,所以叫钟型分布。
钟型分布有对称分布和非对称分布两种。对称分布的特征是中间变量值分布的次数最多,两侧变量值分布次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,如图3-5①。许多客观现象总体的分布都趋于对称分布。例如,农作物的亩产量的分布,学生考试成绩的分布,人体的身长分布等。
在非对称分布中,又有左偏分布(图3-5②)和右偏分布(图3-5③)两种。
2.U形分布。当次数分布出现两端次数较多,靠近中间次数较少的状态时,所绘制的曲线同英文字母U相似,所以叫U形分布。如图3-6所示
有些社会经济现象的分布表现为U型分布,例如,人口死亡率分布。
3.J形分布。J形分布有两种:正J形分布和反J形分布。当次数随着变量的增大而增多,绘制成曲线图,就象英文字母“J”(如图3-7①所示),所以叫正J型分布;当次数随着变量值的增大而减少,绘成曲线图,如反写的英文字母“J”(如图3-7②所示),所以叫反J形分布。
图3-7 J型分布曲线图
在社会经济现象中,有一些统计整体的分布呈J形分布。例如,投资额按利润率大小的分布,老年人口死亡率按年龄的分布,一般均呈正J型分布;而儿童死亡率按年龄的分布,则一般呈反J型分布。
( 4)\ 洛伦兹分布
洛伦兹分布曲线又称为集中曲线.
2\ 次数分布的图示法
即用图形来表示次数分布的方法。常用的有直方图、折线图、曲线图、茎叶图和圆形图等。
(1)直方图。即用直方形的宽度和高度来表示次数分布的图形。如根据表3-12
中资料,可绘制直方图,如图3-1:
(2)折线图。折线图就是在直方图的基础上,取每一个长方形顶边的中点,将这些点用直线连接起来所形成的图形。如根据表3-12中的资料可绘制折线图如图3-2:
(3)曲线图。当变量值非常多,变量数列的组数无限增多时,折线便近似地表现为一条平滑的曲线。这种平滑曲线叫作次数曲线。曲线的绘制方法与折线图基本相同,只是连接各组的线段是用平滑曲线而不用折线。
例如:有10个家庭的住房面积如下: 55、75、75、90、90、90、90、105、120、150
(4)茎叶图。茎叶图又称枝叶图。是把各个变量值分解为两个部分(一是主干部分即“茎”、另一是尾数部分即“叶”)作排列的一种数值分布的图示法。这种数据整理方法将传统的统计分组与画直方图两步工作一次完成,即保留了数据的原始信息,又为准确计算平均指标等统计数量提供了方便和可能。例如某班30名学生的《统计学》考试成绩分别为:45、48、51、52、55、61、62、63、63、64、65、68、69、70、70、71、72、73、74、76、78、79、80、84、85、86、88、90、92、95。以上述资料画图如下。
从图3-3可以看出:观察值的主干部分在竖线的左端,表示“茎”,余下的数字在右端表示“叶”。如第一条茎上的数字表示45分、48分两个观察值;第二条茎上的数字表示51分、52分、55分三个观察值;„„在画图时,要注意“叶”竖行要对齐,这样,“叶”的个数就是各组的的次数。不难看出,将茎叶图竖起来就是一个直方图,各“茎”上“叶”的个数就是各组的次数。茎叶图不仅提供了由次数分布所提供的相似的数据信息,而且也给出了区间内数据的具体分布,便于对原始数据的观察和分析。
(5)圆形图。是用圆形来表明总体内部结构状况的图形。它以全圆面积表示现象总体,把全圆分成若干扇形部分,以表示总体内部各组成部分所占比重的大小。由于扇形面积和圆心角的大小成正比例,圆心角共为360°,所以每36°的圆心角包括了1%的圆面积。我们绘制圆形图时,只要把总体中各组成部分的比重指标分别乘以36°,即可得出各组成部分应占圆心角的度数,然后利用量角器计算所得度数,就可以绘制出总体中各组成部分应占的扇形面积。现利用河南省1998年国内生产总值三次产业构成资料,绘成圆形图,如图3-4所示。
六\ 统计表和统计图
( 一)、统计表的概念和构成
统计表是用纵横交叉的线条所绘制的表格来表现统计资料的一种形式。 统计表是表现统计资料最基本的形式。
统计表的结构
1.\ 从形式上看,统计表由总标题、横行标题、纵栏标题和数字资料四部分构成。
(1)总标题。是统计表的名称,用来概括统计表中全部统计资料的内容。一般写在统计表的上端中央。
(2)横行标题。是统计表各横行的名称,在统计表中通常用来表示各个单位或各组的名称。一般写在统计表的左方。
(3)纵栏标题。是统计表各纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在统计表的右上方。
(4)数字资料。是统计表各横行标题与各纵栏标题交叉处所填写的数字。
2.\ 从内容来看,统计表由主词和宾词两部分构成。
(1)主词。是统计表说明的对象,也就是列在表中的总体及其分组,通常列于横行左端。
(2)宾词。是统计表中说明总体的统计指标,包括指标名称和指标数值。宾词也就是统计表的纵栏标题和数字资料。
统计表的构成如表3-17所示:
(二)、统计表的种类
按统计表所反映的总体的分组情况不同,可分为:
1.简单表。是指统计表所反映的总体未经任何分组,仅罗列出各单位的名称或按时间顺序排列的表格。
2.简单分组表。是指总体仅按一个标志进行分组所形成的表格。如表3-10。
3.复合分组表。是指总体按两个或两个以上的标志进行层叠(或交叉)分组所形成的表格,如表3-18所示:
按统计表的作用不同,可分为:
1.调查表。是在统计调查中用于登记,搜集原始统计资料的表格。
2.汇总表(整理表)。是在统计整理中用来记载统计整理过程和表现统计整理结果的表格。
3.分析表。是统计分析中用来记载计算过程和表现计算结果的表格。
(三)、统计表的设计
为使统计表的设计合理、科学、实用、简明、美观应注意以下问题。
(1)设计表之前,要对列入表中的资料进行全面分析:如何分组?设置哪些指标?哪些放在主词栏?哪些放在宾词栏?等等,要全面考虑,统筹安排,务必使表的设计主次分明,简明醒目、科学合理。
(2)统计表的形式应长宽比例适中,一般为长方形,但不能为正方形;上下两端线应当用粗线绘制,表中其它线条一律用细线绘制。表的左右两端习惯上均不划线,采用开口式。
(3)表中的横行“合计”,一般列在最后一行或最前一行,表中纵栏的“合计”一般列在最前一行。
(4)表的纵栏较多时,为便于阅读与核对指标之间关系,可按栏的顺利编号,习惯上对非填写统计数字各栏分别用(甲)、(乙)、(丙)„„的顺序编号;而对指标数字的各栏分别用(1)、(2)、(3)„„的顺序编号。各栏之间若有计算关系,可用数学符号表示。如(3)=(2)÷(1),表示第三栏等于第二栏除以第一栏。
(5)表中的总标题要简明扼要,并能确切说明表中的内容。标题内或在标题下面说明资料所属时间、空间。
(6)表中的指标数字应有计算单位。如果全表的计量单位都相同,若用“万元”为单位,应在表的右上方注明:“单位:××万元”等字样;如果表中同栏的指标数字计量单位相同而各栏之间不同时,应在各栏标题中注明计量单位。如果表中同行的分组指标数字计量单位相同而行与行之间不同时,应在各栏的前面增加一栏“计量单位”用于标明各行的计量单位。
(7)表内上下各栏数字的位数要对整齐,同类数字要保持有效的统一位数。例如统一规定整数后面保留二位小数等,如果小数点后面是“0”时,应当填上“00”,以表示没有小数。表内若有相同的数字时,应全部重写一遍,不能用“同上”、“同左”等字样表示。没有数字的空格,应用短横线“—”填满,以免被人误为漏填;若有数字很小,达不到规定的小数点时,用虚线“„„”填满,如果某项资料规定免于填报,应当用符号“×”填满。总之,表内各行各栏不应有空格。
(8)表内各主词之间、各宾词之间的排列顺序,应按时间的先后,数量的大小,空间的位置自然合理编排。一般是从小到大,从过去到现在的顺序排列。对某些资料必须进行说明时,应在表的下面注明。
(四)\ 统计图
第二章 统计数据的搜集与整理
第一节 数据的计量与类型
一、 数据的计量尺度
统计数据是对客观现象进行计量的结果。不同的十五计量和测度的程度是不
同。有些可以进行属性分类,有些则可以采用数字计量。不同的计量尺度,可以
得到不同类型的统计数据,使用与不同的统计分析方法。一般可采用的计量尺度
有以下四种:
(一)、 定类尺度
定类尺度也成列名尺度,他就是按照事物的某种属性进行平行的分类或分组。 丁类尺度只是册读了事物之间的类型差别,而事物之间的其他差别却无法表现。 对丁类尺度的脊梁解雇,可以计算每一类中个个体出现的聘书。
在使用定类尺度进行分类是必须符合穷尽和护持的要求。穷尽是指在所作的全部
分类中,必须保证每个个体都能归属于某一类别,不能遗漏。 类别护持是指每
一个体只能在一个类别中出现,而不能在其他类别中重复出现。
(二)、定序尺度
定序尺度有成顺序尺度,它是对事物之间登记差别和顺序差别的一种册度。这
种尺度不仅可以将事物分成不同的类别,还可以确定这些事物的优劣和顺序。也
就是说不仅可以册度类别差,还可以册度次序差。
定序尺度的计量结果虽然也表现为类别,但这些类别之间是可以比较顺序的。相比较而言,定序尺度对事物的计量必定类尺度要精确一些,计量的结果能比较
大小,但不能进行数学运算。
(三)、定距尺度
定距尺度也称间隔尺度。他不仅能够区分事务类型,并进行排序,而且可以
掷出类别之间的差距是多少。定距尺度斯对事物类别或次序之间艰巨的侧度,这
种尺度通常使用自然或无力单位作为剂量的标准。因此,定距尺度的计量结果表
现为数值。由于这类尺度的每一间隔都是相等的,只要给出一个度量单位,就可
以准确地指出两个技术之间的差值。因此,其计量结果可以进行加、减的数学运
算。
(四)、定比尺度
定比尺度也称比率尺度。他预订距尺度属于同一层次,他的计量结果也表现
为数值。它具有以上三种尺度的全部特性,另外还具有一个特性,就是可以计算
两个测读书之之间的比值。这要求定比尺度中必须有一个固定的“零点”,这是
它与定距尺度的差别。定距尺度中的“0”表示一个数值,即“0”水平。而并不
是表示没有。他是一个有意义的数值。但定比尺度则不同,“0“表示没有或不存
在。定比尺度可以进行加、减、乘、除等的数学运算。
上述四种计量尺度对事物的计量是逐步递进的。四种计量尺度的比较如下:
教材 9 页, 表2——1的内容。
在统计分析中,一般情况下,要求测量的层次越高越好,因为高层次的计量
尺度包含有更多的数学特性,运用的统计方法越多,分析越方便。
二、 数据的类型
统计数据是采用某种计量尺度对事物进行剂量的结果。采用不同的计量尺度会
得到不同类型的统计数据。根据剂量的结果来看,统计数据大体可以分为两种类
型,既定性数据和定量数据。
定性数据也称品质数据,是用来说明事物性质特征的,是不能用数值表示的。
这类数据是顶类尺度和定序尺度的计量所形成的。
定量数据也叫数量数据。他是说明事物数量特征的,是可以用具体数值表示的,
这类数据是由定距尺度和定比尺度计量所形成的。对不同类型的统计数据可以采
用不同的统计方法进行处理和分析。
我们知道,用来说明现象属性或特征的概念名城成为变量,变量的具体表现成
为变量值,统计数据就是统计变量的具体表现内容。如果由品质数据表现的脚品
质变量。由数量数据记录的脚数量变量。
三、统计数据的表现形式
数量型的统计数据通常有两种基本的表现形式:即绝对数和相对数。
绝对数是统计数据最基本的表现形式,又称为总量指标。表现现象总体规模和
总体水平的数据都是以绝对数的形式来体现。
1、总量指标按其反映的时间状况不同,可分为时期指标和时点指标。
时期指标,是反映现象在一定时期内发展过程的总量。如产品产量、产值、
商品流转额、人口出生数等。时期指标具有以下特点:
(1)时期指标各时期的数值可以直接相加,其和说明较长时间内社会经济现
象发生的总量。
(2)时期指标的数值大小与时期的长短有直接关系,如一年的商品销售额一
定大于一个月的商品销售额。
(3)时期指标的数值是通过连续登记取得的。
时点指标,是反映现象在某一时刻(瞬间)上状况的总量。如人口数、企业数、
生猪存栏头数、固定资产净值、机器台数,商品库存额等。时点指标具有以下特
点:
(1)不同时点上的时点指标数值不具可加性。不同时点上的时点数值直接相
加,除在有关指标的计算过程中需要外,没有实际意义。
(2)时点指标数值大小与时点间隔没有直接关系。如年末的商品库存额不一
定比某月月末的库存额大。
(3)时点指标的数值一般是通过间断登记取得的。
2、统计数据都有一定的计量单位,不同的计量单位表现不同统计数据,绝
对数按其采用的计量单位不同,可以分为实物量指标、价值量指标和劳动量指标。
实物量指标:就是以实物单位计量的总量指标,如人口总数、职工人数、粮
食产量、钢铁产量、煤炭产量、设备台数等。实物量指标的优点是能直接反映产
品的使用价值的大小;其缺点是指标的综合性能较差。
价值量指标:是以货币单位计量的总量指标,如国民生产总值、国民收入、
固定资产投资额、社会商品零售额等。价值量指标的优点是具有广泛的综合性能
和概括能力;其缺点是指标比较抽象、脱离物质内容。所以分析问题时总是实物
量指标与价值量指标结合应用。
劳动量指标:是以劳动单位计量的总量指标,如出勤工时、缺勤工时、生产
实用工时等。
另外,还有一种复合单位剂量的统计数据,如:货物的周转量以吨公里表示
等。
相对数,是社会经济现象中两个有联系的指标数值之比。其中作为比较
基础的量称为基数,作为进行比较的量称为对比数,即
相对数对比数
基数
相对指标有以下两个特点:第一,它是一种抽象化了的数值,反映现象之间
差别的相对程度;第二,其数值大小不随总体范围的大小而变化。
百分数和千分数是相对数的基本表现形式,就是将对比基数定为100或
1000而计算出来的相对数,分别用%和‟表示。其中百分数是计算相对指标数
值时最常用的一种形式,如计划完成程度、发展速度、增长速度都是用百分数表
示的。当对比的分子数值比分母数值小很多时,宜用千分数表示,如人口出生率、
人口死亡率、人口自然增长率等。
第二节 统计数据的搜集
党通缉的研究工作开始时,首先明确研究为题的目的和所需的资料,然后要
考虑如何收集到这些资料。一是可以利用现成的资料,如公报,年检、数据库提
供的资料等。另一方面是指接收机,即通过调查的方式取得。调查方式得到资料,
可以采用实验式取得, 例如泰勒的科学管理理论中的工作定额远原理。也可以
采用非实验室的,直接观察取得统计资料。
一、 统计数据的直接来源
统计数据的直接来源有两个渠道,一是专门组织调查;二是科学的试验。专
门组织的调查市区的社会经济数据的主要方式,而科学实验室取得自然科学研究
数据的主要渠道。我们在这里主要讨论取得社会经济数据的方式。
统计调查搜集的统计资料有两种:一种是对原始资料的搜集。所谓原始
资料,是指直接向调查单位搜集的,尚待进一步汇总整理,需要从个体过渡到总
体的统计资料。如居民收支状况调查中直接对每个居民收支情况的调查。另一种
是对次级资料的搜集。所谓次级资料,是指已经经过加工整理,由个体过渡到总
体,能在一定程度上说明整体现象的统计资料。但是次级资料都是通过对原始资
料的加工,从原始资料过渡而来的,所以,这些统计资料都来源于原始资料。统
计调查的根本目的就是搜集到丰富的,能够反映社会经济总体现象及其各部分间
相互联系的原始统计资料。
统计调查是统计工作的重要环节,是整个统计工作的基础。在整个统计工作
过程中,它担负着提供基础资料的作用。只有准确及时地搜集到内容丰富合乎客
观实际的统计资料,才能经过统计整理、统计分析等一系列统计处理方法,使统
计研究得出正确的结论。为经济管理和经济决策部门提供可靠的信息,更好地发
挥统计信息、统计咨询和统计监督的职能。
(一)、统计调查方式
统计调查时统计数据的主要来源。在我国,统计调查的组织形式有统计
报表、普查、抽样调查、重点调查、典型调查等。1992年,我国的国家统计系
统已将抽样调查定为统计调查的主体,将周期性的普查作为基础。同时辅之以统
计报表、重点调查和典型调查等组织形式。
1、 普查
普查是一种专门组织的、一次性的全面调查。它主要用来搜集某些不能够
或不适宜于用定期的全面统计报表搜集的统计资料,以搞清重要的国情、国力,
一般用来调查属于某一时点上的社会经济现象的总量,但也可以用来反映时期
现象。
普查是一种很重要的调查方式。通过统计报表,虽然可以搜集全面的基本统
计资料,但它不能代替普查。因为有些社会经济现象,如人口增长及其构成变化、
耕地面积、工业设备等情况不可能也不需要组织经常性的全面调查而国家又必须
掌握这些方面比较全面详细的资料,这就需要通过普查来解决。为了搞清某些有
关国情、国力的重要数字,要分期分批地进行专项普查。如我国于1990年进行
的第四次全国人口普查、1993年进行的第三产业普查、1995年进行的工业普查、
1997年进行的农业普查等。
普查作为一种特殊的统计调查方式,具有以下特点:
第一、具有周期性。因为普查主要调查一定十点上的统计资料,普查可以根据学要临时进行,
也可以按一定的周期进行。目前,我国的普查基本都是周期性的,从2000年起,我国的周期性普查主要包括:人口普查、农业普查和经济普查。人口普查和农业普查每十年一次,分别在0年、6年分别进行;将工业普查、第三产业普查和基本单位普查合并为经济普查,每十年进行两次。
第二 、普查需要规定统一的标准时间:所谓标准时点是指对被调查对象登
记时所依据的统一时点,这个标准时点一经确定所有调查资料都要反映这一时点
上的状况。如我国第四次人口普查反映的就是1990年7月1日零时我国人口的
实际状况。规定标准时间是为了避免搜集资料时由于自然变动或机械变动而产生
的重复或遗漏。这是因为普查是反映现象在某一时点上的情况,为了避免调查资
料的重复登记和遗漏,需要同一时间。
第二、普查的数据规范程度比较高。普查是专门组织的全面调查,可以为抽样调查提供基础
性的数据。
第三、 普查的使用领域是有限的。由于普查动用的热力、物力较多,资金耗费很大,目前
普查仅限于对重要的国情国力数据的收集调查。
各种组织形式的普查工作,由于调查规模大,涉及面广,必须通盘考虑进行
普查的全过程,充分做好普查的组织和准备工作:①建立健全统一的普查领导机
构,并对群众进行广泛的宣传和动员。②设计普查方案,应根据具体目的确定普
查对象和单位、普查项目、普查时间、汇总方案等。③训练普查人员。④组织试
点,总结经验,借以修订普查办法和工作细则,有时还应制订阶段工作进程图,
编制从登记、复查、编码、数据录入直到分析的各个环节工作流程图。试点的过
程也是修改和完善普查方案并从中培训干部的过程,为由点到面开展普查工作奠
定可靠的基础。⑤物质准备,主要包括汇总工具,印发普查文件和经费预算等。
准备工作为普查的全面展开提供了条件。接着进行正式调查登记,将调查资
料及时报送受报机关;汇总分析普查资料报送有关部门;公布资料,总结普查工
作。
2、 抽样调查
抽样调查实施集中应用最广泛的一种调查方法。抽样调查是按随机原则从调查对象中抽取部分单位作为样本,并根据样本资料对总体的数量特征作出科学的估计或推断的一种非全面调查方法。抽样调查是非全面调查,但它的目的却在于取得反映全面情况的统计资料,在一定意义上可以起到全面调查的作用。抽样调查是非全面调查中最完善,最有科学根据的方式方法。
抽样调查有如下几方面的特点:
第一、经济性。
第二、时效性高。
第三、适应范围比较广。
第四、准确性高。
3、统计报表
统计报表是按照国家统一规定的表格形式,统一规定的指标内容,统一的报送程序和报送时间,自上而下统一布置,自下而上地逐级提供基本统计资料的一种报表制度。国家利用它定期地取得全社会的经济和社会发展的基本统计资料。执行统计报表制度,是各地区、各部门、各基层单位必须向国家履行的一种义务。
1.统计报表的特点和优点
(1)统计报表的指标内容、口径范围、计算方法、报送程序和报送时间都是由国家统一规定的,这就保证了搜集资料统一性和有效性。
(2)各级领导部门可以通过统计报表,经常全面了解经济和社会发展变化情况,我国运用的大多数统计报表是全面统计报表,具有全面性。
(3)在调查进行前把报表布置到基层填报单位,以便他们根据报表的要求,及时建立健全各种原始记录,使统计报表的资料来源建立在可靠的基础上,做到资料准确,报送及时。
(4)统计报表是定期地连续观察登记的,因而便于完整地积累资料,系统地分析经济和社会发展变化的规律性。
2.统计报表的种类
(1)按调查范围不同分为全面统计报表和非全面统计报表。全面统计报表要求调查对象中每一个单位都填报。目前,我国采用的统计报表绝大多数都是全面的统计报表。非全面统计报表只要求调查单位中的一部分单位填报。它要结合重点调查、典型调查和抽样调查来运用,如工业主要技术经济指标就采用重点调查方式,农村经济调查就用过抽样调查或典型调查选出调查单位的办法,将统计报表布置给基层填报。
(2)按报送周期长短不同,分为日报、旬报、月报、季报、半年报和年报等。报送周期逾短花费的人力、物力、财力愈多,因此,报送周期短的,指标项目应该少一些,粗一些,时效性要强一些。报送周期长的,指标项目可以多一些,细一些,内容也要更详尽些。一般情况下,日报和旬报只能限于填报生产中最主要指标,凡是年报、半年报能满足需要的,就不要用季报、月报;季报、月报能满足需要的,就不要用旬报、日报。
(3)按报送的单位不同分为基层报表和综合报表两种。基层报表是指由基层企事业单位填制的报表,综合报表是由主管部门或统计部门根据基层报表逐级汇总填制的报表。
(4)按报表内容和实施范围不同,分为国家统计报表、部门统计报表和地方统计报表。国家统计报表是由国家统计部门统一制发,用来搜集工业、农业、交
通运输、基本建设、商业、劳动、物资、科研等方面最基本的统计资料。部门统计报表是根据有关的部门统计调查项目和统计调查计划相应制订的统计报表,一般用来搜集各级主管部门所需的专业技术资料,在各该主管部门系统内施行。地方统计报表是根据有关的地方统计调查项目和统计调查计划相应制订的统计报表,用来满足地方的专门需要。部门和地方统计报表都是国家统计报表的补充。
(四)统计报表的资料来源
统计报表资料来源于基层单位的原始记录。从原始记录到统计报表,中间还要经过统计台帐和企业内部报表。因此,建立健全原始记录制度、统计台帐和企业内部的统计报表制度,是保证统计报表质量的基础。
1.原始记录。原始记录是基层单位通过一定的表格形式,对生产经营活动的过程和成果所作的第一手的数字或文字记载,是未经任何加工整理的初级资料。
原始记录的内容,要因各个基层单位不同情况而定,不求千篇一律。但总的来说,一套完整的原始记录,应包括以下内容:①记录项目和记录表格。将需要记录的具体内容表格化,使记录的各项内容体现在表格上。②负责记录的人员。对每个原始记录表格,要明确规定负责记录的人员。③各种原始记录表格每次记录的份数,传递的路线和报送的时间。
2.统计台帐。统计台帐是基层单位根据填报统计报表和本单位经营管理的需要而设置的一种系统积累统计资料的表册。统计台帐的基本形式,大体上有以下两种:①多指标的综合台帐,这种台帐是在一个表册上,按时间顺序,同时登记若干有关指标数值的发展变化情况。如企业或车间为检查各项主要指标完成情况而设置的主要指标完成情况台帐。②单指标分组台帐。这种台帐是在一个表册上,按时间顺序,同时登记各个下属单位某一指标数值的发展变化情况。
3.内部报表。基层单位的内部报表,大致有两类:一类是为向单位领导提供资料而编制的;一类是为填报上级规定的统计报表而布置的。这两类报表的内容有相同的地方,也有不同的地方。但都要求本单位内的各个有关科室、班组、车间或有关人员填报,按一定的传递程序,最后集中到主管统计工作的科室。由原始记录到统计台帐到统计报表的程序如下:
原始记录
↓
班组台帐→班组报表
↓
车间台帐→车间报表
↓
科室台帐→企业内部报表
↓—→国家统计报表
4、重点调查
重点调查是指在调查对象范围内,只选择一部分重点单位进行调查,借以了解总体基本情况的一种非全面调查。
所谓重点单位,是指在总体中举足轻重的那些单位。这些单位虽可能数目不
多,但就调查的标志值来说,它们在总体中却占有很大的比重,能反映出总体的基本情况。例如,要了解全国钢铁生产的基本情况,只要调查占全国钢产量比重很大的鞍钢、上钢、包钢、太钢、宝钢、首钢、武钢等几个钢铁企业就可以了。重点调查较之全面调查省时省力,而且能更加及时了解总体的基本情况。在调查对象中确实存在着重点单位,而且调查的任务只要求了解总体的基本情况而不是总体的准确数值时,进行重点调查是比较适宜的。它将是我国今后统计调查方法体系中一种重要的辅助方法。
重点调查可以是经常性调查,也可以是一次性调查。组织重点调查的首要问题是确定重点单位。对重点单位的选择应满足以下要求:
1.重点单位选多选少,要根据调查任务确定。一般说来,选出的单位应尽可能少些,而其标志值在总体中所占比重应尽可能大些。
2.选中的单位,管理应比较健全,统计力量应比较扎实,这样才能准确,及时的取得资料。
5、典型调查
典型调查就是根据调查的目的和要求,在对研究对象进行全面分析的基础上,有意识地选择部分有代表性的单位进行调查,以认识事物发展变化的规律性的一种非全面调查。
这种调查具有两个特征:第一,它是深入细致的调查。它的调查范围小调查单位少,因而指标可以多一些,用来研究某些比较复杂的专门问题。第二,调查单位是根据调查的目的和任务,在对调查总体进行全面分析的基础上,有意识地选择出来的。
典型调查是一种比较灵活的统计调查方法,它既可以注重于现象的量的方向和数量关系的分析,也可以从质的方面分析数量和数量关系形成的原因;可以是对某一问题纵向方面进行研究,深入少数单位了解问题的历史和现状,也可以是就某一问题从横向方面进行探讨,了解问题在不同条件下的不同表现。
典型调查有以下几方面的作用:
1.补充全面调查的不足。这可以从两方面来理解,一是对于不需要或不可能通过全面调查和其他非全面调查取得的统计资料,用典型调查来弥补。例如,为了研究粮、棉比价是否合理,不需要进行全面调查,只要运用典型调查方法,取得若干有代表性的国有农场和村民委员会的统计数字就解决问题了;二是对全面调查中发现的问题,可深入有关单位进行典型调查,弄清问题所在的实质原因。
2.在一定条件下,验证全面调查资料数字的真实性。例如,从全部基层单位填报的数字中抽出一部分基层单位的数字进行检查,看其是否有弄虚作假现象,从中发现一些规律性的东西。
3.可以研究新生事物,了解新情况,新问题。新生事物在开始时往往是少数,无法进行全面调查,只有运用典型调查方法,抓住典型把握事物发展方向,才能为正确处理问题提供依据。
6、各种调查方式的结合运用
(二)、统计数据的搜集方法
1、访问调查
2、邮寄调查
3、电话调查
4、座谈会
5、个别深度访问
(三)、调查方案设计
统计调查是一项复杂而又细致的工作,一个规模较大的统计调查项目往往需要动员成千上万人协同工作才能完成。为了在统计调查过程中统一认识,统一内容,统一方法,统一步调,顺利完成任务,在调查前必须有一个统一的统计调查方案。切实可行的统计调查方案是保证统计调查有计划,有组织地进行的首要步骤,是统计设计在调查阶段的具体化。
一个完整的调查方案,应包括以下几个方面的内容:
1、确定调查的目的
明确统计调查的目的和任务是制订统计调查方案的首要问题。对任何社会经济现象的研究,可以根据不同的目的,不同的任务从不同的角度去搜集资料。如对工业经济情况的研究可以从工业生产方面去研究,也可以从农工商的关系去研究,还可从工业产品成本,工业内部的结构等方面去研究。调查的目的和任务不同,调查的内容和范围也就不同。目的不明任务不清,就无法确定向谁调查,调查什么,以及用什么方式方法进行调查。这就会使调查工作带有很大的盲目性,调查到的资料可能是不需要的,需要了解的情况而又得不到充分的反映,这样不仅会造成人力、物力、财力的大量浪费,而且还会延误工作。
有明确确定统计调查的目的和任务,必须根据党的方针政策和当前形势出发,立足于统计工作的整体需要,抓住实际上最重要最急迫的问题,并要认真分析制订的计划和调查对象的实际情况,把需要与可能结合起来。
2、确定调查对象和调查单位
确定调查对象和调查单位是回答向谁调查和由谁来具体提供统计资料的问题。调查的任务和目的明确以后,就要确定调查对象和调查单位。调查对象就是需要调查的社会现象的总体,它是由性质上相同的许多调查单位所组成。调查单位就是构成社会现象总体的个体,是调查项目的具体承担者,也就是在调查对象中所要调查的具体单位。例如:调查目的是搜集全市小学状况的资料,那么,该市所有小学就是调查对象,而全市的每一所小学就是调查单位。又如,调查的目的是搜集国有工业企业的设备资料,则调查对象是一切国有工业企业的所有设备,而国有工业企业的每一台设备则是调查单位。
在统计调查阶段了规定调查单位外,还要规定填报单位。调查单位是调查项目的承担者,而填报单位则是负责向上报告调查内容的单位。调查单位和填报单位在多数调查中是一致的,如在上述第一个例子中,全市的每一所小学既是调查单位,又是填报单位。有时二者又不一致,如在上述第二例子中,工业企业中每台设备是调查单位,而填报单位则是指每个工业企业。确定调查对象使我们知道所要了解的总体界限,确定调查单位使我们知道从哪里去取得有关标志的具体资料,确定填报单位使我们知道由谁提供具体资料。
3、确定调查项目、设计调查表
调查内容是指所要调查的具体项目,在进行调查之前,必须根据调查的目的,明确规定统计的调查项目,一般说来,确定调查项目应注意以下几点:
第一,确定调查项目,要有取得资料的可能性。凡是列入调查表,确定为调
查内容的项目,必须能够取得确切的资料。否则,既使需要,但没有条件取得确切资料的项目,也不该列入。同时,对每一个调查项目都应该有确切的涵义和统一的解释,以免因为调查人员理解不同而致使调查结果不一致。
第二,被确定为调查内容的每个项目间,应该彼此衔接,以便对现象的相互联系从整体上了解,也便于有关项目相互核对,提高调查资料的质量。
第三,调查项目之间时间上要有可比性,即本次调查项目和过去同类调查项目之间要互相衔接,以便进行动态对比。
第四,能确定的项目必须与调查目的有关。只登记与问题有关的标志,不应包括可有可无备而不用的标志。
调查的内容明确以后,就要根据一定的目的,把拟确定的调查项目按照一定的顺序排列成表格的形式,这就是调查表。它包括需要向调查单位了解的有关品质标志,数量标志和其它情况。它是回答向有关单位调查什么的问题。
调查表是调查方案的核心部分。必须紧紧围绕调查目的,从现象间的相互联系,从现象的过去、现在和发展等方面出发,提出所要调查的项目,拟定调查表。
调查表的形式一般有单一表和一览表两种。单一表每份表上只登记一个调查单位,它可以容纳较多的调查项目,在整理和汇总时便于利用调查表按各种标志分组计算。如工业企业的产品产量,产品成本等定期报表都采用单一表形式。一览表是在一张调查表上登记若干个调查单位,它所容纳的调查项目要少一些,我国人口普查表一般是这种形式。一览表的好处是每个调查单位的共同事项只需登记一次,节省人力和时间,表中有关单位和资料可以相互核对检查。在统计调查表中采用哪种表格形式,一般可考虑以下两方面情况:第一,看调查项目的多少。在调查项目较多时,可采用单一表,调查项目不多时,可采用一览表。第二,看调查单位和报告单位是否一致,如果是一致时采用单一表,否则,可采用一览表。
调查表确定以后,需要编写填表说明和指标解释,这是为了保证调查资料的科学性和统一性必备的调查文件。
调查问卷是搜集资料的又一种形式和载体。调查问卷是调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种调查形式。不同的调查问卷在具体结构、题型、措辞、版式等设计上会有所不同,但在结构上一般都由以下几个部分组成:①开头部分。它一般包括问候语、填表说明和问卷编号等内容;②甄别部分。甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要的部分,然后针对特定的被调查者进行调查;③主体部分。该部分是调查问卷的核心内容,它包括了所要调查的全部问题,主要由问题和备选答案所组成;④背景部分。它通常放在问题的最后,主要是有关被调查者的一些背景资料。
在设计调查问卷时应注意:①对每个问题和答案的设计,应充分考虑到问题的统计方法;②问卷用语要准确、规范,注意被调查者的身份和思维习惯;③问卷格式要整齐,编码要规范;④问题应当短小,便于作明确的答复;⑤问题的排列应当具有逻辑性;⑥对敏感性问题设计问卷时应遵守保密的原则。
4、其他相关内容
调查的组织实施计划是调查工作顺利开展的重要保证,一个完整的组织实施计划应包括以下几方面的内容:
(一)确定调查时间
调查时间是指调查资料所属的时间。如果所要调查的是时期现象,就要明确该现象是从何年何月何日起到何年何月何日止。如果所调查的是时点现象,就要
明确规定统一的标准调查时点。
为了保证统计资料的及时性还必须规定调查期限。调查期限是指进行调查工作的时限,包括搜集资料和报送资料的整个工作所需的时间。规定调查期限要考虑调查项目的复杂性和调查资料的时效性。一般调查期限不宜过长。
(二)确定调查地点
调查地点是指登记调查资料的地点。通常,调查地点和调查单位所在地是一致的。但是在二者不一致的情况下必须明确规定调查的地点。如进行人口普查时,如果按“常住人口”登记,不论被调查者是否暂时外出居住,都应在每个居民的常住地点进行登记。
(三)做好严密细致的组织工作
这是统计调查顺利实施的保证。调查工作的组织主要应包括以下内容:调查工作的组织领导机构和调查人员的组织;调查的方式方法;调查前的准备工作,包括宣传教育,干部培训,文件印刷等;调查资料的报送办法;调查经费的来源,开支办法;提供或者公布调查成果的时间,等等。
制定一定规模的统计调查方案,还需要进行试点调查。通过试点,检验调查方案,积累组织实施的经验。
二、统计数据的间接来源
三、统计数据的误差
误差是指所收集的资料与实际之间的差距。产生误差的原因多种多样,大致有三类:抽样误差、调查误差和其他误差。
臭氧误差是抽样调查中存在的,是不可避免的,具体的计算在抽样推断章节中介绍。
调查误差是调查过程中产生的,原因是多方面的。如:对问题的理解、概念的错误、计量标准的错误等引起的误差。这类误差是调查过程中尽量可以避免或减少的误差。
其他误差不时发生在调查过程中的误差。如:记录、打印、抄写等产生的误差等。
第三节 统计数据的整理
当采用各种方式将统计数据搜集上来之后,就需要对统计数据进行加工整理,使之系统化,条理化。
一、数据整理的概念和内容
(一)、统计整理的概念
统计整理是根据统计研究的任务与要求,对统计调查所取得的各种原始资料进行科学的汇总和加工,使之系统化、条理化,从而得到反映总体特征的综合资料的工作过程。这项工作也包括系统地积累资料和为研究特定问题对资料的再加工。
(二)、 统计数据整理的意义
统计调查所取得的原始资料都是零星的、分散的、不系统的,仅能表明各个调查单位的具体情况,反映事物表象的一个侧面,不能说明被研究总体的全貌。因此,只有对这些资料进行科学地加工整理才能认识事物的本质,暴露事物的内部矛盾,得出正确的合乎事物发展规律与趋势的分析结果。
统计整理是统计工作的第三阶段,是统计调查的继续和统计分析的前提条件。它在整个统计工作中具有重要作用。统计资料整理的好,会使综合的资料十分完备和丰富;而不适当的加工整理,会使调查得来的大量原始资料失去价值和效用。所以,统计整理具有三个过渡作用,即由说明个体的材料过渡到说明总体的材料;由说明局部情况的材料过渡到说明全局的材料;由反映现象不系统不完备的材料过渡到反映现象系统的完备材料。
(三)统计数据整理的方法
统计数据整理的方法十分组、汇总和边表。
统计分组是统计数据整理的关键。汇 总是在统计分组的基础上,将各组的总体单位数汇总出来。编表是将汇总的结果通过一定的表格形式表现出来。
(四)、统计整理的步骤
1、数据的审核和筛选
2、数据的排序
3、数据的分组和汇总
4、频数分布
5、编制统计表格
二、 数据的审核与筛选
审核是统计资料整理加工中的首要环节,是对资料进行“深加工”的第一道工序。审核的内容主要包括以下几个方面:①准确性审核。准确性审核的内容包括两个方面:一是检查数据资料是否真实地反映了调查单位的客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确。审核资料准确性的方法主要有逻辑检查和技术检查。逻辑检查一般用来检查调查表中的内容是否合理、各调查项目所填数据或结果是否矛盾等;技术检查主要用于检查各类调查表及统计报表中的一些差错和问题的,如调查表的栏目有无错填、有无重复填报和缺填、数值的计量单位有无差错等。②及时性审核。主要是检查调查表或统计报表是否在规定的时间内报送,若没有按时报送,应催促其及时上交,并找出迟报的原因并商讨解决的办法。③完整性审核。主要是审核应调查的单位是否有遗漏,所有的调查项目或指标是否填写齐全。
三、 数据的排序
四、 统计分组
分类就是对资料按照某一标志或某几个标志进行分组,划分为若干部分。分类标志和分类方法的选择取决于分析研究的目的。
编码就是对需要整理加工的标志,按分类的先后顺序对每一种分类进行编码,根据这种编码,在每一份调查采集表格上的有关项目上标明所属分类的号码。这是为后面的汇总程序作准备,对保证整理加工的质量起到重要作用,便于我们进行汇总、核对和查找。
汇总根据汇总要求和工作条件选择适当的汇总组织形式和汇总的具体方法;按分组要求进行分组汇总,计算各组的单位数和合计总数,计算各组指标和综合指标。
(一)、统计分组的意义
根据统计研究的任务和对象特点,将统计总体的各个单位按照一定的标志区分为若干个组成部分的一种统计方法。虽然社会现象复杂多样,但现象之间常常既有某种共同的性质,又在质与量方面存在着种种差异。因此,只有通过科学而合理的统计分组,才能揭示现象内部各部分之间存在的客观差异,表明事物的本质和规律。统计分组具有两方面的含义:从总体角度看,它是“分”的过程,是把总体中的大量个体分成一个个性质不同的、范围更小的总体;从个体角度看,它又是“合”的过程,是把总体中有共同特征的单位集合起来成为一组。
(二)、统计分组的种类
1、按任务和作用的不同分组
分为类型分组,结构分组和分析分组。类型分组的目的是划分现象的经济类型;结构分组的目的是研究现象总体的内部构成;分析分组的目的是研究现象总体内部的依存关系。
2、安分组的标志多少分组
分为:
简单分组,就是总体按一个标志分组。
符合分组就是总体按两个获两个以上的标志重叠起来进行的分组。
3、安分组标志的性质分组
可以分为品质分组和变量分组。
(三)、分组体系和分组标志的选择
1、分组体系
任何统计总体都是由多个方面构成的有机整体,要全面认识总体的特征,就需要运用多个标志进行多次分组。将一系列相互联系的统计分组有机地结合在一起而形成的分组整体,就是统计分组体系。统计分组体系有两种不同的形式。
(1 )、平行分组体系(简单分组体系)
如果总体按照一个标志进行分组就称为简单分组。对同一总体选择两个或两个以上的标志分别简单分组就称为平行分组体系。例如,人口总体按性别、文化程度、婚姻状况等标志进行的分组,就是一个平行分组体系:
男性人口 (1
女性人口
文盲、半文盲人口
受过小学教育的人口
(2 受过初中教育的人口
受过高中教育的人口
受过大学教育的人口
(2)、复合分组体系
对同一总体选择两个或两个以上标志层叠(或交叉)起来分组,称为复合分组,复合分组本身构成复合分组体系。如对高等学校在校生可先按学科分组,然后对第一层次所分的各个组,再按性别分组,即构成复合分组体系:
理科学生组
男生组
女生组
文科学生组
男生组
女生组
工科学生组
男生组
女生组
在进行复合分组时,应先根据研究目的,确定主辅分组标志,先按主要标志对总体进行第一层次分组,然后再按辅助标志对第一层次所分的各组进行第二层次的划分。
2、分组标志的选择
统计分组的关键问题是选择分组标志与划分各组的界限,它不仅直接影响分组的科学性与统计资料整理的准确性,而且最终影响统计分析结果的真实性与可靠性。
正确地选择分组标志,是统计分组的核心问题。正确选择分组标志应遵循以下基本原则:
(1)、.要根据统计研究的目的与任务选择分组标志。由于统计研究的任何一个总体,都有许多标志。所以正确合理选择分组标志,就显得特别重要。例如,工业企业这个总体就有职工人数、产量、固定资金、流动资金、利税额等多种标志。在研究工业企业问题时,究竟选用哪个标志作分组的依据呢?一要看研究的是什么问题,二是在许多标志中,要抓住具有本质性的或主要的标志作为分组的依据。例如,在研究工业企业的经济效益时,一般要选择利税额标志分组,而不宜选择产量标志分组,因为产量高低不能说明经济效益的好坏。总之,在选择分组标志时,要注意避免选用一些形式的、不触及问题实质的标志。
(2)、.要根据现象所处的历史条件及经济条件选择分组标志。人类在不断进步,社会在不断发展,标志的选择随历史条件和经济条件的变化而变化。例如,在研究工业企业规模时,职工人数、产值、固定资产价值等都可以作为分组的标志。究竟选用哪一种标志呢?这就要看具体条件。在技术不发达的条件下,用职工人数的多少来表示企业规模的大小就比较恰当,而在技术进步的条件下,采用固定资产价值标志就会更切合实际。即使在同一历史条件下,在不同的经济部门或生产部门中,由于它们的经济条件不同,也必须分别对待。例如,在当今时代条件下,对劳动密集型、技术密集型、资金密集型的企业,就不能选用同一个标志来表示其规模的大小。显然,对劳动密集型企业,选用职工人数表示其规模就会合适些,对后者则选用固定资产价值标志更合适些。
(四) \ 统计分组的方法
1 \ 品质标志分组方法
品质分组一般比较简单. 按品质标志分组形成的分布数列称品质数列。例如,1998年底我国的从业人员人数按三次产业标志分组,可编制如下品质数列:
表3-9 1998年底我国从业人员人数的构成情况
各组名称 次数 频率
这个品质数列可以说明1998年底我国从业人员的构成情况及特点。
所有的品质数列,都是由两个基本要素构成:组的名称和各组的单位数(又称次数或频数)。如将各组单位数计算成比重则称频率。
2\ 数量标志分组方法
按数量标志分组形成的分布数列,称作变量数列。如将某班学生《统计学》课程考试情况按考分这个数量标志分组,即得到变量数列,如表3-10所示:
各组变量值 次数 频率
这个变量数列可以反映出该班学生《统计学》考试成绩的构成情况。
从表3-10所示,变量数列也有两个密不可分的要素组成,即各组变量值和各组单位数。
(1 )\ 单项式分组
单项式数列是以每一个变量值作为一个组而形成的分布数列。它一般是在分组的数量标志为离散性变量且变量的变异幅度较小的情况下编制的。
例如:
上例表明,工人生产的产品少者是7件,多者是10件,变量的变异幅度不大,组数也不太多,只有四组,这种变量数列,就是单项式变量数列。
(2 )\ 组距式数列
组距数列是由表示变量变动的一定范围或一定距离的两个变量值作为一个组而形成的分布数列。组距数列适用于按连续性变量分组或变量的变动范围较大的离散性变量分组的情况。如表3-12所示:
在组距数列中:每个组两端的数值称为组限,它分为上限和下限两种。每组的起点标志值叫做下限,如表3-12中的450、500、550、600、650、700分别为第一组至第六组的下限;每组的终点标志值叫做上限,如表3-12中的500、550、600、650、700、750分别为第一组至第六组的上限。
(3 )\ 等距和不等距.
每组的上限数值与下限数值之差叫做组距。
组距数列按其各组的组距是否相等,可以分为等距数列和异距数列。数列中每组的组距都相等叫做等距数列。如表3-12就是等距数列。数列中每组的组距并不都相等叫做异距数列。如表3-13所示:
研究的目的,一般当客观现象性质差异的变动比较均衡时,宜采用等距数列,而当客观现象性质差异的变动不均衡时,则宜采用异距数列。
编制组距数列中,特别需注意处理好以下几个问题。
1\. 确定变量的类型。一般地说,如果离散性变量的变异幅度较小,应把每个变量值列为一组,编制单项式变量数列,如果变量的变异幅度大,就应编制组距数列;对于连续性变量不能编制单项式的变量数列,只能编制组距数列。
2\ .确定组距与组数。在编制变量数列时,对全体变量值划分的部分数,就是组数,组数的多少和组距的大小互相制约,互相影响,二者成反比关系。确定组距与组数的基本原则是,要符合现象的实际情况,能够把总体次数分布的特点充分显示出来,对于是先确定组距还是先确定组数的问题应具体问题具体分析,灵活处理,一般来讲应先确定组距,组距确定以后,组数也就出来了。在等距数列情况下,组数等于全距除以组距。
3.\ 确定组限和组中值。在统计工作中,正确地划定组限,主要根据统计认识的目的和遵守组限能反映事物性质或特征的数量界限原则。
组限的确定,还要考虑作为分组标志的变量的类型,通常用连续型变量进行分组时,相邻两组交界处的组限应该重合,现举例说明如下:
邻两组的下限与上限不重合,势必形成空隙,使处在空隙中的变量值无法分组。用离散性变量进行分组,相邻两组的下限与上限不应重合,如:
即相邻两组交界处的组限可以重合。
综上所述,不论是利用连续性变量或是离散性变量分组,所编制的组距数列,都需出现组限重合的问题,在这种情况下对那些分组标志值重合的总体单位数,分到哪一组呢?一般应遵循“上限不在内”的原则,例如,在表3-14中年收入是1500元的农民数应统计到第三组中去,年收入2000元的农民数应统计到第四组中去。
在编制组距数列时,还应明确什么是开口组、闭口组、什么是组中值。开口组是只有上限缺下限,或只有下限缺上限的组;闭口组指下限与上限都齐全的组;组中值是上限与下限之间的中点数值,在统计实践中,需用组中值来代表组的一般水平。其计算公式如下:
组中值上限下限
开口组的组中值确定,一般是以其邻组组距为准:
缺上限的开口组组中值下限邻组组距
缺下限的开口组组中值上限邻组组距
五 、 频数分布
(一)\ 分配数列的概念\构成要素
分布数列是将统计总体按某一标志分组后,用来反映总体单位在各组中分布状况的统计数列。分布数列主要用来研究总体各单位的分布状况和总体的构成,并据以研究总体某一标志的平均水平及其变动的规律性。
分配数列有两个构成要素: 总体的分组和各族对应的单位数.
(二)\ 分配数列的类型
(三)\ 频数和频率
频数是分布在各组中的总体单位数。如果用相对数形式表示,便是比重(或称频率)。各组次数或比重的大小,意味着相应的变量值在决定总体数量表现中所起的作用不同。次数或比重大的组,其变量值在决定总体数量表现中的作用就大,反之就小。由于社会经济现象性质的不同,各种统计总体都有不同的次数分布,形成各种不同类型的分布特征。通过次数的分布特征,可以研究大量社会经济现象的统计规律性。
(四)\ 次数分布的类型和表示方法
1\ 分布的类型
各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有钟型分布,U型分布,J型分布。
1.钟型分布。当次数分布出现两端次数较少,靠近中间次数较多的状态时,所绘制的曲线图,就象一口古钟,所以叫钟型分布。
钟型分布有对称分布和非对称分布两种。对称分布的特征是中间变量值分布的次数最多,两侧变量值分布次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,如图3-5①。许多客观现象总体的分布都趋于对称分布。例如,农作物的亩产量的分布,学生考试成绩的分布,人体的身长分布等。
在非对称分布中,又有左偏分布(图3-5②)和右偏分布(图3-5③)两种。
2.U形分布。当次数分布出现两端次数较多,靠近中间次数较少的状态时,所绘制的曲线同英文字母U相似,所以叫U形分布。如图3-6所示
有些社会经济现象的分布表现为U型分布,例如,人口死亡率分布。
3.J形分布。J形分布有两种:正J形分布和反J形分布。当次数随着变量的增大而增多,绘制成曲线图,就象英文字母“J”(如图3-7①所示),所以叫正J型分布;当次数随着变量值的增大而减少,绘成曲线图,如反写的英文字母“J”(如图3-7②所示),所以叫反J形分布。
图3-7 J型分布曲线图
在社会经济现象中,有一些统计整体的分布呈J形分布。例如,投资额按利润率大小的分布,老年人口死亡率按年龄的分布,一般均呈正J型分布;而儿童死亡率按年龄的分布,则一般呈反J型分布。
( 4)\ 洛伦兹分布
洛伦兹分布曲线又称为集中曲线.
2\ 次数分布的图示法
即用图形来表示次数分布的方法。常用的有直方图、折线图、曲线图、茎叶图和圆形图等。
(1)直方图。即用直方形的宽度和高度来表示次数分布的图形。如根据表3-12
中资料,可绘制直方图,如图3-1:
(2)折线图。折线图就是在直方图的基础上,取每一个长方形顶边的中点,将这些点用直线连接起来所形成的图形。如根据表3-12中的资料可绘制折线图如图3-2:
(3)曲线图。当变量值非常多,变量数列的组数无限增多时,折线便近似地表现为一条平滑的曲线。这种平滑曲线叫作次数曲线。曲线的绘制方法与折线图基本相同,只是连接各组的线段是用平滑曲线而不用折线。
例如:有10个家庭的住房面积如下: 55、75、75、90、90、90、90、105、120、150
(4)茎叶图。茎叶图又称枝叶图。是把各个变量值分解为两个部分(一是主干部分即“茎”、另一是尾数部分即“叶”)作排列的一种数值分布的图示法。这种数据整理方法将传统的统计分组与画直方图两步工作一次完成,即保留了数据的原始信息,又为准确计算平均指标等统计数量提供了方便和可能。例如某班30名学生的《统计学》考试成绩分别为:45、48、51、52、55、61、62、63、63、64、65、68、69、70、70、71、72、73、74、76、78、79、80、84、85、86、88、90、92、95。以上述资料画图如下。
从图3-3可以看出:观察值的主干部分在竖线的左端,表示“茎”,余下的数字在右端表示“叶”。如第一条茎上的数字表示45分、48分两个观察值;第二条茎上的数字表示51分、52分、55分三个观察值;„„在画图时,要注意“叶”竖行要对齐,这样,“叶”的个数就是各组的的次数。不难看出,将茎叶图竖起来就是一个直方图,各“茎”上“叶”的个数就是各组的次数。茎叶图不仅提供了由次数分布所提供的相似的数据信息,而且也给出了区间内数据的具体分布,便于对原始数据的观察和分析。
(5)圆形图。是用圆形来表明总体内部结构状况的图形。它以全圆面积表示现象总体,把全圆分成若干扇形部分,以表示总体内部各组成部分所占比重的大小。由于扇形面积和圆心角的大小成正比例,圆心角共为360°,所以每36°的圆心角包括了1%的圆面积。我们绘制圆形图时,只要把总体中各组成部分的比重指标分别乘以36°,即可得出各组成部分应占圆心角的度数,然后利用量角器计算所得度数,就可以绘制出总体中各组成部分应占的扇形面积。现利用河南省1998年国内生产总值三次产业构成资料,绘成圆形图,如图3-4所示。
六\ 统计表和统计图
( 一)、统计表的概念和构成
统计表是用纵横交叉的线条所绘制的表格来表现统计资料的一种形式。 统计表是表现统计资料最基本的形式。
统计表的结构
1.\ 从形式上看,统计表由总标题、横行标题、纵栏标题和数字资料四部分构成。
(1)总标题。是统计表的名称,用来概括统计表中全部统计资料的内容。一般写在统计表的上端中央。
(2)横行标题。是统计表各横行的名称,在统计表中通常用来表示各个单位或各组的名称。一般写在统计表的左方。
(3)纵栏标题。是统计表各纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在统计表的右上方。
(4)数字资料。是统计表各横行标题与各纵栏标题交叉处所填写的数字。
2.\ 从内容来看,统计表由主词和宾词两部分构成。
(1)主词。是统计表说明的对象,也就是列在表中的总体及其分组,通常列于横行左端。
(2)宾词。是统计表中说明总体的统计指标,包括指标名称和指标数值。宾词也就是统计表的纵栏标题和数字资料。
统计表的构成如表3-17所示:
(二)、统计表的种类
按统计表所反映的总体的分组情况不同,可分为:
1.简单表。是指统计表所反映的总体未经任何分组,仅罗列出各单位的名称或按时间顺序排列的表格。
2.简单分组表。是指总体仅按一个标志进行分组所形成的表格。如表3-10。
3.复合分组表。是指总体按两个或两个以上的标志进行层叠(或交叉)分组所形成的表格,如表3-18所示:
按统计表的作用不同,可分为:
1.调查表。是在统计调查中用于登记,搜集原始统计资料的表格。
2.汇总表(整理表)。是在统计整理中用来记载统计整理过程和表现统计整理结果的表格。
3.分析表。是统计分析中用来记载计算过程和表现计算结果的表格。
(三)、统计表的设计
为使统计表的设计合理、科学、实用、简明、美观应注意以下问题。
(1)设计表之前,要对列入表中的资料进行全面分析:如何分组?设置哪些指标?哪些放在主词栏?哪些放在宾词栏?等等,要全面考虑,统筹安排,务必使表的设计主次分明,简明醒目、科学合理。
(2)统计表的形式应长宽比例适中,一般为长方形,但不能为正方形;上下两端线应当用粗线绘制,表中其它线条一律用细线绘制。表的左右两端习惯上均不划线,采用开口式。
(3)表中的横行“合计”,一般列在最后一行或最前一行,表中纵栏的“合计”一般列在最前一行。
(4)表的纵栏较多时,为便于阅读与核对指标之间关系,可按栏的顺利编号,习惯上对非填写统计数字各栏分别用(甲)、(乙)、(丙)„„的顺序编号;而对指标数字的各栏分别用(1)、(2)、(3)„„的顺序编号。各栏之间若有计算关系,可用数学符号表示。如(3)=(2)÷(1),表示第三栏等于第二栏除以第一栏。
(5)表中的总标题要简明扼要,并能确切说明表中的内容。标题内或在标题下面说明资料所属时间、空间。
(6)表中的指标数字应有计算单位。如果全表的计量单位都相同,若用“万元”为单位,应在表的右上方注明:“单位:××万元”等字样;如果表中同栏的指标数字计量单位相同而各栏之间不同时,应在各栏标题中注明计量单位。如果表中同行的分组指标数字计量单位相同而行与行之间不同时,应在各栏的前面增加一栏“计量单位”用于标明各行的计量单位。
(7)表内上下各栏数字的位数要对整齐,同类数字要保持有效的统一位数。例如统一规定整数后面保留二位小数等,如果小数点后面是“0”时,应当填上“00”,以表示没有小数。表内若有相同的数字时,应全部重写一遍,不能用“同上”、“同左”等字样表示。没有数字的空格,应用短横线“—”填满,以免被人误为漏填;若有数字很小,达不到规定的小数点时,用虚线“„„”填满,如果某项资料规定免于填报,应当用符号“×”填满。总之,表内各行各栏不应有空格。
(8)表内各主词之间、各宾词之间的排列顺序,应按时间的先后,数量的大小,空间的位置自然合理编排。一般是从小到大,从过去到现在的顺序排列。对某些资料必须进行说明时,应在表的下面注明。
(四)\ 统计图