《EXCEL在统计学中的应用》
第一章 EXCEL简介
在统计数据处理中,EXCEL是相对操作比较简单也比较容易得到的软件。对于一般的统计分析其功能也相对全面,因此我们想就EXCEL在统计工作中的应用显见要做一些介绍,在以后的章节将分别详细介绍。
一、 功能简介
EXCEL在统计分析中主要用到以下几个功能:统计制表、统计制图、描述统计、统计分析计算。
(一) 制表、制图
(二) 分析工具库
在EXCEL中有一个统计分析工具库,当我们运行工具---加载宏后,在工具下拉菜单下则会出现“数据分析”子菜单,点击它可以完成以下统计计算,见图1-1。
(三) EXCEL公式和统计函数
EXCEL公式和统计函数的内容我们单独分一长介绍。
第二章 EXCEL公式和统计函数
Excel具有强大的计算功能。它不但能利用公式进行简单的代数运算,而且能分析复杂的数学模型。它的数学、统计、财务等10类300多种函数 (预定义的内装公式),可以直接用于计算。它可以使用数组公式同时进行多重计算,并得 出一个或多个结果。本章根据统计计算的要求,重点讲述在Excel中如何使用公式和函数。
第一节 公式概述
公式是在工作表中对数据进行分析计算的等式。公式的计算范围不仅限于本工作表的数值,还可以包括同一工作簿中不同工作表的数值,乃至其他工作簿中工作表的数值。公式的内容包括运算项(元素)和运算符。运算项可以是数值,
也可以是单元格或单元格区域的引用,或单元格的标志和名称,还可以是工作表函数。这些运算项的具体内容将在后面分别详述,本节先对公式的运算符、运算顺序、输入公式、编辑公式等作一简介。
一、公式的运算符
公式的运算符有以下四种类型。(一)算术运算符:包括+、-、*(乘)、/(除)、%、 ^(乘方)。遇有负数可在前面加-号,或用括号表示。%和前面的数字连在一起作为一个数值处理,例如5%,系统将自动转换为0.05计算。
(二)比较运算符:包括;、>、=(大于或等于)、(不等于)。
比较运算符可用于比较两个数值,其运算结果产生逻辑值TRUE或FALSE.。例如,对公式:A2>100进行运算,结果如出现TRUE,表示公式成立,A2真的大于100;如出现FALSE,则表示公式不能成立,A2不大于100。
(三)文字运算符:连字符&。Excel不仅能进行数值运算,而且能进行文字值(文字型数据)的运算。利用连字符&,可以把一个或多个文字值连接起来,求得一个连续的文字值。例如:公式:“一季度”&“销售额”,即把“一季度”和“销售额”两个文字值连接起来,成为“一季度销售额”。如果一季度所在的单元格为A3,还可以将公式改为;A3&“销售额”,即把单元格和文字值连接起来。但要注意:文字值必须加双引号,以便识别。
(四)引用运算符:在公式中如要引用单元格或单元格区域的地址(行列号)进行运算,必须加引用运算符。引用运算符有三种。一是联合运算符,以逗号(,)表示。例如:公式:SUM(B3,B4,B5,B6,B7),表明要将B3、B4、B5、B6、B7五个单元格的数值相加求得合计。式中:SUM是求和函数,括号内是函数的参数,五个单元格之间要用逗号隔开。二是区域运算符,以冒号(:)表示。例如:、公式:SUM(B3:B7),表明要把B3至B7单元空格表示。例如:公式:SUM(B3:B5 A4:C4),表明竖向B3:B5和横向A4:C4两个交叉区域的数值相加求和,中间要用空格表示交叉,交叉处的单元格B4同时从属于两个区域的引用。交叉运算符使用较少。
二、公式的运算顺序
工作表中的公式是按照一定的顺序进行计算的,这种顺序可称之为语法。按照语法的要求,公式必须从:号开始,后面是参加计算的运算项和运算符。在各类运算符中,首先运行引用运算符,其次运行算术运算符,再其次运行文字运算符和比较运算符。其中,算术运算符的计算顺序是:负数-、%、 ^、*和/、+和-。例如=5+2*3,首先计算2*3=6,然后计算5+6=11。如要提前计算5+2,需用括号将其括起来,公式改为:(5+2)*3,计算结果为21。同一级的运算符如*和/,按从左到右的顺序进行计算:如有需要提前计算的部分,也要用括号括起来。
三、公式中数值的转换
在公式中,各种运算符都要求有一定类型的数据与之相适应。如果输入的数据类型不符合要求,有些将自动转换为可用的类型,有些则不能计算。举例如下:
[例]公式:“1”+“2”。式中使用+号,其运算项应是数字;现在1和2带有双引号,表明是文字型数据。但系统能自动将其转换为数字进行计算,计算结果为3。
[例]公式=10-“$4.00”。式中$4.00是文字型数据;但系统不考虑其货
币符号,转换为数字计算,计算结果为6。
[例]公式=“98-7-1”-“98-5-25”。式中是两个表示日期的数值,要求计算二者之间相差的天数,系统可将其转换为内置的序列数然后计算,计算结果为37天。
[例]公式=SQRT(“8+1”)。式中$QRT是求平方根函数,括号内的参数“8+1”格式不对,不能转换为数字,屏幕显示出错信息#VALUE!。如果把参数改为“9”或“8”+“1”,则可转换为数字计算,求得结果为3。
四、输入公式
比较简单的公式,可直接在单元格中输入。首先单击待输入公式的单元格,然后输入:号和公式的内容(窗口上方编辑栏中同时显示公式)。输入完毕回车确认,计算结果即自动记入该单元格内,编辑栏中的公式消失。如要再查看公式内容,可双击该单元格,公式即重复出现:再回车,又返回计算结果。
比较复杂的公式,最好在编辑栏中输入。首先也要选定待输入公式的单元格,然后单 击编辑栏中的“编辑公式”按钮(:),其右侧框中即出现一个:号(同时在其左侧出现“输入”按钮√和“取消”按钮X;还在编辑栏下方弹出计算结果显示框,框的右端并列“确定”和“取消”两个按钮),用户可在:后面输入公式,输入终了,计算结果即显示在编辑栏下的显示框中。再回车确认,或按“确定”按钮、或按“输入”按钮,均可将计算结果记入选定的单元格内。
在公式中如需使用函数,可单击编辑栏左端框旁的向下箭头,从弹出的常用函数列表中选定所需要的函数,即出现该函数的对话框(帮助信息称“公式选项板”)。在对话框上部参数框中输入必要的参数,对话框底部即显示出计算结果。再回车确认,计算结果即记入选定的单元格内。如果常用函数列表中没有所需要的函数,可单击“其他函数”项,屏幕弹出“粘贴函数”对话框,再从中选择所需要的函数。
输入数组公式与输入单值公式方法基本相同。首先单击待输入公式的单元格,如要求给出多个结果需单击待输入公式的单元格区域;然后输入公式,系统将自动为公式加上大括号
五、编辑公式
如要修改公式,需先单击包含待修改公式的单元格,.然后在编辑栏中进行修改,修改后回车确认。公式中如果引用了单元格行列号,将会自动按修改后的行列号重新计算,得出新的结果。如要修改公式中的函数,必须同时修改函数的参数。修改数组公式,可单击编辑栏,大括号自动消失;修改后按Ctrl+Shift+Enter组合键结束操作。
如要移动公式,也需先单击包含待移动公式的单元格,然后将鼠标指针指向选定区域的边框,按住鼠标左键将其拖至目标区域左上角的单元格,放开鼠标,即替换了目标区域的全部数据。复制公式与移动公式操作基本相同,只在拖动选定区域时需按住Ctrl键。应当指出,移动或复制公式,需从“工具”菜单的“选项”中选择“视图”卡,在“窗口选项”下单击“公式”选项。还需指出,移动公式单元格引用不改变;复制公式,单元格绝对引用
也不改变,但单元格相对引用将会改变。关于绝对引用和相对引用的含义下节详述。
删除公式也要先单击包含待删除公式的单元格,然后按Delete键即可删除。
如要删除
数组公式,需先单击数组区域中任一单元格,然后在“编辑”菜单中选择“定位” 命令,
按下“定位条件”按钮,从其对话框中选择“当前数组”项,再按Delete键删除。
六、公式的出错提示
如果公式不能正确算出结果,系统将会显示一个错误值。有时公式引用韵单元格有错误,
也会使公式产生错误。现将各项错误值的涵义和常见的错误简述如下。
(一)错误值的涵义
·#####! 输入或计算结果的数值太长,单元格容纳不下。
·#VALUE! 使用了错误的参数,或运算对象的类型不对。
·#DIV/0! 公式中除数为0,或引用了空单元格或包含0值的单元格。 · #NAME? 公式中使用了不能识别的单元格名称。
·#N/A 公式或函数中没有可用的数值。 .
·#REF! 单元格引用无效。
· #NUM! 公式或函数中某一数字有问题。
· #NULL! 对两个不相交的单元格区域引用使用了交叉引用运算符(空格)。 .
-如要了解各项错误值产生的原因和处理方法,可单击“帮助”菜单中的“创建公式和审核工作表”,从中选择“公式与错误值疑难解答”。
(二)常见错误 ,
公式可能出现的错误很多,常见的主要有以下几项。
1.圆括号()未成对出现,二者缺一。
2.引用单元格区域使用了不正确的运算符,应使用冒号(:) 。
3.缺少必选的参数,或输入了多余的参数。
4.在函数中使用嵌套函数不符合要求。
5.引用工作簿或工作表的名称中含有非字母字符,但未加单引号。
6.外部引用缺少工作簿名称和路径。
7.公式中输入数字不应加格式,如$1,000,应输入1000,不应带货币符号和千分位点。
第二节 公式中单元格的引用
一、引用的作用和常设形式:
公式中“引用”的作用在于标出工作表上参加计算的单元格或单元格区域,指明公式计算用数据的位置。一个公式可以引用工作表上不同单元格的数据,多个公式也可以引用同 一单元格数据;还可以引用同一工作簿中不同i作表的数据,或是不同工作簿中工作表的数据,乃至其他应用程序的数据。引用其他工作簿的数据叫做外部引用,引用其他应用程序的数据叫做远程引用。 引用有A1和R1C1两种表现形式,常设为A1形式(默认形式)。这种形式用英文字母表示列,用数字表示行。例如:
要引用A列5行交叉处的单元格,可输入A5。
要引用A列5行至10行的单元格区域,可输入A5:A10(中间的冒号表示起止范围)。
要引用A列5行至E列5行的单元格区域,可输入A5:E5。
要引用5行各列所有的单元格,可输入5:5。
要引用5行至10行各列所有的单元格,可输入5:10。
要引用C列各行所有的单元格,可输入C:C。
要引用C列至E列各行所有的单元格,可输入C:E。
在公式中利用单元格引用进行计算,可以迅速简便地得出结果。举例说明如下:
上表,单元格B5、C5、D5、E5、E2、E3、E4都需计算合计数。例如:要计算B5单元格的合计数,需先选定该单元格,然后单击编辑栏的=号,再单击编辑栏左端函数框向下的箭头,从弹出的函数列表中选择求和函数SUM,在SUM对话框的Numberl(参数1)框中输入单元格引用B2:B4,经回车确认,其计算结果1368即自动记入该单元格内。其他各单元格的合计数均可照此计算。不仅如此,如果将鼠标指针移至该单元格右下角的填充柄上,当指针变成+字形时按住鼠标左键向右拖曳,至E5单元格放开鼠标,可以一次求得C5、D5、E5的合计数(实际是移动公式的一种方法)。E2至E4单元格的合计数也可照此求得。
二、绝对引用和相对引用
绝对引用是指当复制公式时,公式中引用的单元格位置不变;相对引用是指当复制公式时,公式中引用的单元格位置将随之改变为新的位置。在公式中,一般使用相对引用;如果要求复制公式时引用的单元格位置不变,则需使用绝对引用。使用绝对引用的好处是:可使存放固定数值(如税率、利率等)的单元格位置不致在复制公式时发生变动。在A1形式下,如要使用绝对引用,需在列标和行号前面加上美元符号$。例如:A5,需改为$A$5。
引用的另一种形式R1C1,也可以用于绝对引用和相对引用。要使用R1C1形式,需在“工具”菜单中单击“选项”,从其对话框中选择“常规”选项卡,在选项卡的“设置”项下选择“R1CI引用样式”(前面方框中出现√号)。R1C1形式与Al形式不同的是:引用单元格的行和列都用数字表示,行号前加字母R,列号前加字母C;而且R1C1本身是绝对引用,相当于A1形式下的$ASl。要在R1C1形式下使用相对引用,需给行号和列号加上方
括号[ ]。举例如下:
引用R表示对当前行的绝对引用。
引用C表示对当前列的绝对引用。
引用R2C2 表示对2行2列单元格的绝对引用。
引用R[2]C[2] 表示对当前行向下第2行、当前列向右第2列单元格的相对引用。
引用R[-2]C 表示对当前列向上第2行单元格的相对引用(-号表示逆向)。
引用RC[-2] 表明对当前行向左第2列单元格的相对引用。
引用R[-2] 表明对当前行向上第2行整行单元格区域的相对引用。 此外,在复制公式时,如果只要求引用单元格的行保持不变(列可以变),或者只要求引用单元格的列保持不变(行可以变),就需要使用混合引用。即在一次引用中,既有绝对引用,又有相对引用。例如:在A1形式下引用$A5,表明是对A列的绝对引用和对5行的相对引用;引用A$5,表明是对5行的绝对引用和对A列的相对引用。在R1C1形式下引用R[-2]C2,表明是对当前行向上第2行的相对引用和对当前列向右第2列的绝对引用;
引用RC[-2],表明是对当前行的绝对引用和对当前列向左第2列的相对引用。
三、三维引用和外部引用
当需要引用一个工作簿中多个工作表的同一单元格或单元格区域时,可使用多维引用。
例如:某商场的“销售额”工作簿中包含12个月份的“销售额”工作表,现在要汇总全年的销售额,就需要使用三维引用。假定要在汇总表的B2单元格中记入销售额全年总计,首先要将该单元格击活,然后输入“=SUM(Sheetl:Sheetl2!A2)”。式中:Sheetl:Sheetl2是1-12月的工作表标签,!号将工作表和单元格隔开,A2是销售额所在的单元格。输入完毕回车确认,即将计算结果记入B2单元格内。
由于三维引用涉及到多个工作表,如果工作表发生变动,就必然会影响三维引用。下面以公式“=SUM(Sheet3:Sheet6!B2:B5)”为例说明其影响。
如果在引用工作表范围(Sheet 3:Sheet 6)中插入另一工作表,则该工作表单元格区域(B2:B5)的数值也要计算在内。
如果在引用工作表范围中删除某一工作表,则该工作表单元格区域的数值也要被去掉。
如果把引用工作表范围中的某一工作表移至范围以外,则该工作表单元格区域的数值也会被删除。
如果把引用范围起止的工作表(Sheet3或Sheet6)移至工作簿的其他位置,系统将自动调整引用范围,包含新的起止位置中间的所有工作表。
引用其他工作簿数据的外部引用,其操作方法和三维引用基本相同,只是在输入公式时需依次输入其他工作簿的名称、工作表的名称、引用的单元格或单元格区域。上例,如果是五个单位的全年销售额,分别存在工作簿Bookl至Book5的工作表Sheetl的A2单元格中,可在当前工作表的A1单元格中输入“=SUM([Bookl]Sheetl:[Book5]Sheetl!A2)”,回车确认,即将五个单位的全年销售额汇总到一起。
四、公式的循环引用 ·
在公式中直接或间接引用了自身所在的单元格,叫做循环引用。出现循环引用有两种情况。一种是输入公式错误,当回车确认时,系统给出提示,指出“此公式不能计算”。此时如按提示单击“确定”按钮,系统将自动显示“循环引用”工具栏,并指出产生循环引用的单元格(该单元格中出现一个蓝色圆点,屏幕底行状态栏显示“循环”二字及该单元格的位置),可重新输入正确公式,消除循环引用。另一种情况是有些公式需要循环引用,可使用“迭代法”算出结果。要使用迭代法求解循环引用,其步骤如下:
首先,单击“工具”菜单中的“选项” ,在弹出的对话框中打开“重新计算”选项卡。
其次,在选项卡的左侧选定“反复操作”项(前面出现√号),回车确认,即可按默认的最多迭代次数100和最大误差0.001进行运算(默认值如不合适可以改变)。
最后,当迭代次数和误差有一项达到要求时,即自动停止运算,显示出计算结果。
兹再举一简例说明求解循环引用。假定A1单元格的数值为2000,b1单元格的公式为=Al-C1,C1单元格的公式为=B1*0.3,两个公式互相引用。现按
上述方法反复操作,即可求得结果,C1单元格为461.5384,B1单元格为1538.4616。
第四节 使用函数
如前所述,函数是预先确定含义的内装公式。函数可以在公式中使用,也可以单独使用。
使用函数可以简化计算、提高效率、减少差错,故在工作中应尽量利用函数。
一、可用子统计的函数
Excel为用户提供了数学和三角函数、统计函数、数据库函数、财务函数、工程函数、
逻辑函数、文本函数、日期和时间函数、信息函数、查找和引用函数等10类300多种函数,
可以满足多方面的计算要求。其中,以统计函数为最多,达78种;此外还有14种数据库函
数可从数据库提取数据进行计算,以及在统计中经常使用的数学、统计函数20种,合计112种。
现将这些函数列表如下:
函数名称功能简介
一、统计函数
1.用于数据整理的函数
FREQUENCY 以垂直数组形式求频率分布
2.用于描述统计的函数
MODE 求‘组数据的众数
MEDIAN 求一组数据的中位数
AVERAGE 求一组数据的均值
AVERAGEA 求数据清单中数据的均值
HARMEAN 求调和平均数
GEOMEAN 求几何平均数
TRIMMEAN 求去掉最大值和最小值的平均数
MAX 求数据清单中的最大值
MAXA 求数据清单中包含逻辑值和字符串的最大值
MIN 求数据清单中的最小值
MINA 求数据清单中包含逻辑值和字符串的最小值
LARGE 求一组数据中第K个最大值
SMALL 求一组数据中第K个最小值 ,
QUARTlLE 求一组数据的四分位差
AVEDEV 求样本数据与其均值的平均离差
DEVSQ 求样本数据与其均值离差的平方和
STDEV 求样本标准差
STDEVA 求包含逻辑值和字符串的样本标准差
STDEVP 求总体标准差
STDEVPA 求包含逻辑值和字符串的总体标准差
VAR 求样本方差
VARA 求包含逻辑值和字符串的样本方差
VARP 求总体方差
VARPA 求包含逻辑值和字符串的总体方差
KURT 求一组数据的峰度
SKEW 求一组数据的偏度
用于概率分布的函数
B1NOMDIST 求二项分布的概率
NEGBINOMDIST 求负二项分布
CRITBINOM 求累积二项分布大于或等于临界值的最小值
PISSON 求泊松分布
NORMDIST 求非标准正态分布的累积函数
NORMINV 求非标准正态分布累积函数的逆函数
NORMSDIST 求标准正态分布的累积函数
NORMSINV 求标准正态分布累积函数的逆函数
STANDARDIZE 求Z分布的正态化数值 ·
LOGNORMDIST 求对数正态分布的累积函数
LOGINV 求对数正态分布累积函数的逆函数
HYPGEOMSIST 求超几何分布
BETADIST 求ß分布的累积函数
BETAINV 求ß分布累积函数的逆函数
GAMMADIST 求ν分布的累积函数
GAMMAINV 求ν分布累积函数的逆函数
GAMMALN 求ν分布累积函数的自然对数
EXPONDIST 求指数分布
WEIBULL 求韦伯分布
PROB 求指定区域内事件对应概率之和
PERMUT 求从数据集合中选取若干对象的排列数
4.用于参数估计的函数
CONFIDENCE 求总体均值的置信区间
5.用于假设检验的函数
CHIDIST 求七’分布的单尾概率
CHIINV 求刀’分布单尾概率的逆函数
CHITEST 求七’分布的统计量和相应的自由度
ZTEST 求2检验的双尾概率
TDIST 求/分布
TINV 求/分布的逆函数
TTEST 求/分布相关的概率
FDlST 求9分布
FINV 求F分布的逆函数
FTEST 求F检验的单尾概率
6.用于方差分析的函数
COVRB 求协方差
7.用于相关和回归的函数
CORREL 求相关系数
PEARSON 求皮尔逊乘积矩相关系数
RSQ 求皮尔逊乘积矩相关系数的平方
FISHER 求费雪变换值(用于相关系数的假设检验)
FISHERIVE 求费雪变换的逆函数
LINEST 建立直线方程
INTERCEPT 求直线方程的截距
SLOPE 求直线方程的斜率
FORECAST 求线性趋势值(预测值)
TREND 求线性趋势值(预测值)
STEYX 求趋势值的标准误差
LOGEST 建立指数曲线方程
GROWTH 求指数曲线趋势值(预测值)
8.其他统计函数
COUNT 求数组中数据的个数(只计算数字型数据)
COUNTA 求数组中数据的个数(包含逻辑值、文本值等)
RANK 求某一数值在数组中的排位
PERCENTRANK 求某一数值的百分比排位
PERCENTILE 求数据区域中第尺个百分比数据
二、数据库函数
DCOUNT 计算数据库中符合指定条件并含有数字的单元格数
DCOUNTA 计算数据库中符合指定条件的非空单元格数
DGET 从数据库中抽取一个符合指定条件的记录
SUBTOTAL 将数据清单、数据序列和数据库中的数据分类汇总
DSUM 计算数据库中符合指定条件的记录字段数值之和
DPRODUCT 计算数据库中符合指定条件的记录字段数值的乘积
DAVERAGE 计算数据库中指定项目的平均数
DMAX 从数据库指定项目中求最大值
DMIN 从数据库指定项目中求最小值
DSTDEV 以数据库中指定项目为样本求标准差
DSTDEVP 以数据库中指定项目为总体求标准差
DVAR 以数据库中指定项目为样本求方差
DVARP 以数据库中指定项目为总体求方差
SOLREQUEST 链接外部数据源,从中查找数据,以数组形式求得结果,不编程
三、统计中常用的数学函数
SUM 参数求和
SUMIF 将符合指定条件的单元格相加
PRODUCT 参数相乘
QUOTIENT 求两数相除的整数部分
MOD 求两数相除的余数
POWER 求数值的乘幂
SQRT 求平方根
RAND 求0~1之间的随机数
RANDBETWEEN 求指定的两数之间的随机数
COMBIN 求指定对象数目的组合数
COUNTIF 求符合指定条件区域的非空单元格数
FACT 求某数的阶乘
LN 求某数的自然对数
LOG 求某数以指定数为底的对数
LOGl0 求某数以10为底的对数
SUMPRODUCT 求两组对应值的乘积之和∑xY
SUMSQ 求参数的平方和 ∑X2,∑y2
SUMXMY2 求两数组对应值之差的平方和 ∑(x-y)2
SUMX2MY2 求两数组对应值平方差之和 ∑(x2-y2)
SUMX2PY2 求两数组对应值平方和之和 ∑(x2+y2)
第三章 统计数据的整理与显示
统计数据的整理即就是统计分组和排序,如何将分组以后的数据表示出来,使其一目了然的反应数据的分布状况,EXCEL可以帮助我们完成这些工作。甚至我们可以利用EXCEL提供的分析工具---直方图,直接让计算机帮助我们分组并将其分布特征展示出来。本章将通过几节内容介绍这些方法。
第一节 用EXCEL制表
在Office办公集成软件中,Word、Excel、Access都能制表:但各有不同特点和不同适用范围。Excel主要适用于包含复杂计算、统计分析、数据检索、排序和绘制统计图的表格。本文先举一实例简要说明Excel的制表过程,然后再系统地讲述Excel制表的各项功能。
上表操作过程简述如下:
(1)打开计算机,进入Excel后,整个窗口呈现出一个横竖线交插的大表。表的上端用A、B、C„„标明列号;表的左侧用1、2、3、„„标明行号(统计表横称行,竖称列或栏;由横竖线组成的长方格叫单元格;将列号和行号组合起来表示单元格的位置(地址),如A1、B2、C3、„„。这张大表就是Excel的操作区。区中;列数最多可达256列,行数可达16384行,组成的单元格数达16384X256个;但窗口只能显示8列、16行、128个单元格,其余部分需用垂直滚动条和水平滚动条上下左右滚动显示。
(二)由于操作区本身就是一张大表,所以无须另建表格,可以直接向表格中输入数据。但为操作方便起见,也可以先画出表的边框线。加边框线首先要选定操作对象,即给操作对象做上标记。上表,1'-4行是表头各栏,即指标名称;5~11行是各类型企业的指标数值;横向由A至P共16列。为此可将鼠标指针(空十字形)移至A1单元格(在表的左上角),然后按住鼠标左键斜向拖至P11单元格(在表的右下角。也可以按住Shift键用方向键移至p11单元格),拖过的区域即反白显示,表明已被选定。接着单击菜单栏的“格式”项,其下拉菜单中选择“单元格” ,在弹出的“单元格格式”对话框中一排列出数字、对齐、字体、边框、图案、保护6个选项卡,可从中选择“边框”卡,单击上边框、下边框、左边框、右边框和列间隔线五个按钮,回车确认,即显示出带边框的表式。为了把表头和指标数值隔开,还可以将鼠标指针移至A4单元格,然后按住鼠标左键向右拖至P4单元格(或按住shift键用右向键移至,P4单元格),在“格式”菜单中选择“单元格·”;再选择“边框”,单击下边框按钮,回车确认,即在表头和指标数值中间插入一条横表格线。
(三)表的轮廓确定后,可以一边输入数据,一边对表格进行必要的调整和修改。操作中需使用以下一些功能。
1不论进行何种操作,都必须首先选定操作对象。将鼠标指针移至某一单元格,单击鼠标左键,该单元格周围即出现一个方框,表明已被选定,成为当前活动的单元格(只有在当前活动的单元格中才能进行各项操作)。按住鼠标左键向选定的单元格上下左右拖动(或按住Shift键用方向键移动),可将相邻的单元格一起选定。先选定一行,然后按住鼠标左键上下拖动(或用方向键移动),可选定多行。先选定一列,然后按住鼠标左键向左右拖动(或用方向键移动),可选定多列。如要选定全表,可单击表的左上角行列相交处的空格。
2.操作区单元格列宽的默认值为8.38(单位是标准字符个数,2个标准字符的位置可容纳1个小四号汉字)。这与例中要求不符,需进行调整。调整的方法是首先选定要调整的列,然后从“格式”下拉菜单中单击“列”选项,再在“列”的子菜单中选择“列宽”,在“列宽"框中输入要调整的字符个数,回车确认,列宽即改变过来。上表A列需容纳16个汉字,可输入入32;I列需容纳4个汉字,与默认值接近,可以不变:M列需容纳5个汉字,可输入10;其余各列需容纳3个汉字,可输入6。
调整列宽还有一个简便方法,即将鼠标指针移至两个列号之间,当指针变成“中间两条竖线边两个反向箭头”形状时,按住左键向左拖动(缩小)或向右拖动(扩大),拖至需要的宽度放开鼠标,即可完成操作。此法最好先输入一些能决定列宽的数据,以之作为调整列宽的依据。
3.上表表头中有些单元格需要合并。例如:D、E、F列第一行“资本金”,G—P列第
一行“年末资产” ,以及下面的“流动资产”和“固定资产”,都需要将横向相连的若干单元格合并在一起。又如:由于表头占了4行位置,有的栏目需将竖向相连的2个、3个或4个单元格合并在一起。不论横向或竖向的合并,选定待合并的单元格后,都可以在“格式”下拉菜单中单击“单元格”选项,再从弹出的对话框中选择“对齐”卡,在屏幕左侧“文本控制”项下单击“合并单元格”项,回车确认,所选单元格即合并成一个大的方框。
4.单元格合并后往往缺少必要的框线,例如:上述“资本金”“年末资产”“流动资产” “固定资产”都没有下框线,可继续上项操作,在“格式”下拉菜单中选择“单元格”项,从弹出的对话框中选择"边框”卡,单击下边框按钮,回车确认,即添加出下边框线。
5.在合并后的单元格中输入数据,从水平方向来说可靠左、靠右、或居中,从垂直方向来说可靠上、靠下、或居中,这可以在设置“合并单元格”时一起设定。在“对齐”选项卡左侧“文本对齐”项下,有一个“水平对齐”框和一个“垂直对齐”框,用鼠标左键按住
框旁三角,从其下拉列表中选择需要的对齐方式,回车确认,即可达到要求(输入文字默认为靠左对齐,输入数字默认为靠右对齐)。此外,在合并后的单元格中,如果要输入的数据不止一行,还可以在“对齐”卡左侧“文本控制”项下选择“自动换行”项,待输满一行后即可自动转至下行。
6.要输入数据(包括文字和数值),需先进行光标定位。即将鼠标指针移至待输入数据的单元格,单击鼠标左键,使之成为当前活动的单元格,然后开始输入操作(双击鼠标左键,将出现一个直线形光标,用方向键移动光标,可确定输入的位置)。如要输入文字,还需选定所用的中文输入法,即将鼠标指针移至屏幕底行右端,单击“En”按钮.(En是“英语”)
一词的缩写,表明常设为英语输入状态),从“输入法”列表中选择自已惯
用的输入法,屏幕底行即出现该输入法的名称。上表输入开始,可先激活Al至A4的大单元格,如已设定“居中”“靠左”对齐,光标即停在单元格中部左侧,可输入“企业类型”四字,中间用适
量空格隔开。输入终了,如果按回车键,可将光标移至下行A 5单元格,继续输入“XX集团公司总计” :如果按右向一键,可将光标移至右列B1至B4大单元格,继续输入“企业单位数”。以下各行各列均可照此操作。在B、C、E、F、G、K、M、N、O、P各列中,都有己合并需输入二、三行文字的单元格,如未事先设定“自动换行”,可在输满一行后用A1t+回车键换行。F列输入完了后,屏幕上已看不到右边各列,需将鼠标指针移至水平滚动条右侧,连续单击右向三角形按钮,使右边各列左移,以便继续输入数据。
7.表中B、C两列需进行求和计算,此项操作最好是利用“格式”工具栏下面的编辑栏进行(其实以上各项操作也都可以利用编辑栏进行)。编辑栏左端显示当前活动单元格的位置;往右单击“:”可出现一个:号,;号后面可输入计算公式;在;号左面单击√按
钮可确认输入,单击X按钮可取消输入。例如;要计算企业单位数的总计,可先单击B5单元格,然后在编辑栏右侧输入公式“=B6+B7+B8+B9+B10+B11”,或输入“=SUM(B6:B11)”,按下√按钮,计算结果即自记入B5单元格内(公式中,:号必不可少。相加各项最好是用“单元格位置引用”,当修改某项数值时总计数将会随之改变。SUM是求和函数,“B6:B11”表示由B6至B11,(中间的冒号指明计算范围)。也可以先选定B6;B11单元格,然后单击“常用”工具栏右起第9个按钮∑(自动求和”符号),其总计数即自动记入B5单元格内。C5单元格总计数的计算方法与此相同。其余“资本金”的合计,“年末资产”的总计,以及“流动资产”和“固定资产”的合计,未列出数字,实际在工作中均可照此计算。
8.除以上各项外,还要给表格加上标题和必要的注释。上表实际操作时,可预留两行空行以备输入标题,即表格边线从第3行画起。现为说明方便起见未留空行,需再插入两个空行。其法首先单击1、2行的单元格将其击活,然后在“插入”菜单中单击“行”选项,表上即出现两个空行(行号下移两格,表从3行开始)。再按前述方法在“格式”菜单中单击“单元格”选项,利用“对齐”卡中“合并单元格”功能将两个空行合并,即可输入标题“财务指标汇总表
(一)”。又,为了说明上表因横向超过页宽需分两页打印,也可按上述方法在表下选定一个空行,输入注释。
9.最后不要忘记存盘,以备将来再用。存盘的方法可单击“常用”工具栏左起第一个按钮,或在“文件”下拉菜单中选择“另存为”项,在弹出的对话框顶端“保存位置”框中显示“My Documents”(意为“我的文件”,是C盘上的一个文件夹),在对话框底部“文件名”框中可输入对上表的命名(一般用1~8个英文字母)系统将自动加扩展名.XLS予以保存。
10,表格制成以后,有时还需进行一项额外操作。用Excel制作的表格,往往需要插入用Word编写的统计分析报告或统科学论文中,其最简单的方法是利用剪贴板功能。首先,在Excel中选定待复制的表格,从“编辑”下拉菜单中选择“复制”项,,将该表格暂存于
剪贴板上;然后退出Excel(如能进行多窗口操作也可以不退出),打开Word文件,将光标移至待复制Excel表格的位置,从“编辑”下拉菜单中选择“粘贴”项,即将表格复制过来。Excel表格复制到Word文件中,列宽、字体、·字号和各列指标数值一般不会改变:但表头部分的行高和格式可能发生变化,需用Word
制表功能加以调整,然后存为Word文档。
通过上述实例对Excel的制表过程已有初步了解,下面将分别讲述Excel在建立表格、编辑表格和表格格式化等方面的功能。
二 建立表格
如前所述,进入Excel后整个操作区就是一张大表,所以建立表格的操作主要是向表格中输入数据。输入数据的基本方法上节已经讲过,现再作些补充。
(一)在选定的区域内,如果沿行的方向输入数据,每个单元格输入完了后,可按Tab键或右向一键移至右侧的单元格继续输入:输入到区域的右边界时,光标将自动移至下一行开始处。如果沿列的方向输入,每个单元格输入完了后,可按回车键或向下的1键移至下一行继续输入;输入到区域的下边界时,光标将自动移至下一列的开始处。
(二)表格中如有要输入相同数据的若干单元格,可先按住Ctrl键逐一选定,然后在当前活动单元格中输入数据,再按Ctrl+回车键,即可完成操作。
(三)输入数字如果未事先设定数字格式,应注意以下几点:
输入负数,前面加“一”号,或用“()”括起来。 输入的数字如果带有小数点,必须将汉字输入法后面方框中的标点按钮“。,”切换成英文标点“.,” , 输入日期,年月日之间要用“/”或“-”隔开。例如:99年7月1日可输入7/1/99,或99—7—1。如要输入当天日期,可按Ctrl+分号“;”键。 输入时间,如采用12小时制,先在时间数字后面输入一个空格,然后如是上午再输入字母a,如是下午再输入字母p。如要输入当前时间,可按Ctrl+Shift+冒号“:”键。
输入分数,为避免与日期混淆,可在前面加0及空格。如:二分之一可输入“01/2”。 输入数字长度超过单元格列宽,将自动改为科学记数形式(科学记数的读法见第四节)。如仍超过列宽,将出现错误值“####!”,需靠调整列宽解决。
(四)输入数字如要带有相同位数的小数或尾0,可在“工具”下拉菜单中单击“选项”,再单击“编辑”选项卡,从弹出的对话框中选择“自动设置小数点”(前面方框中出现√号),在“位数”框中输入正数是设置小数位数,输入负数是设置尾0个数。在输入过程中如要暂时取消此项设置,可在输入数据后再键入一个小数点。
(五)如果某行、某列需输入有规律的序列数据,如:年度、季度、月份、星期、1234等,可在前两个单元格中输入前两个数据,然后用鼠标左键按住第二个单元格的“填充柄”(右下角的黑方块),拖曳到结束的单元格,序列数据将自动“填充”在相应的单元格中。如果是不便预置的序列如单位的人员名单等,还可以自定义序列。其法首先在“工具”下拉菜单中选择“选项”,从中选择“自定义序列”选项卡,在选项卡中部的“输入序列”表中逐一输入人员姓名,然后单击“添加”按钮,将名单添加到选项卡左侧的“自定义序列”列表中。当需要使用名单时,可在选定的单元格内输入名单的任意一项,然后用鼠标左键按住该单元格的填充柄拖曳至结束处,即自动填写出整个名单。“自定义序列”选项卡见图3-1
图3-1 自定义序列”选项卡
(六)利用Excel的“自动更正”功能,可将经常使用的词汇定义为一个短语,以后再输入此短语时,该功能可将其转换为原定义的词汇,从而提高输入效率。方法:工具自动更正,在弹出对话框的“替换”框中输入使用的短语,在“替换为”框中输入被定义的词汇;然后按下“添加”按钮,回车确认,输入的短语和被定义的词汇即列入下面的表中。
(七)为了防止输入数据出现错误,可以事先设置好数据格式,以便在输入过程中进行检查。方法,首先选定待输入数据的单元格区域。然后单击“数据”“有效数据”选项,在弹出的对话框中选择“设置”选项卡,再在“有效条件”项下单击“许可”框旁向下的三角,从其下拉列表中选择需要的项目。例如,选择“小数”或“整数”,选定后即出现“数据”“介于”“最小值”和“最大值”两个空框,可分别输入规定的上、下限数值,回车确认执行。如果输入的数值中有低于下限或高于上限的数值,按下Enter键就提示“输入值非法”。以后如果不再需要此项限制,可以打开“有效数据”对话框,将此项功能取消。
第三节:表格的编辑与修饰
表格的编辑与修饰一般包括:单元格内容的移动复制和清除;单元格、行或列的插入和删除;工作表的插入、删除和复制;行宽和列高的调整;字体、字号字形的选择;数字格式的选择;设置对齐方式;设置边框和底纹,这些操作在一般的EXCEL教材中均能见到,在此不用详细阐述。
第四章:EXCEL做图
在我们统计分析中常用的统计图有条形图、茎叶图、直方图、曲线图等待,这些图都可以在EXCEL完成。用图形描述数据的目的是对数据集的特征做出概括。本章将向你展示如何用EXCEL如何绘制能降数据集的性质传递出来的各种图形。
第一节 定性数据的图形描述
对于定性数据而言,条形图和饼图是用的最普遍的两种图形。这种图形显示了落入每一个定性类别中的观察值的多少(频数或频率)。下面我们根据调查的来的无锡使2003年12月份房屋销售套数数据用条形图反映其分布特征。
步骤一:在工具栏点击图表按纽(菜单“图表—图表类型)
步骤二:选择数据源
步骤三:填上图表标题、分类轴、数值轴
步骤四:选择图表保存位置
最后点击完成,将图表保存在当前数据工作表(或另存为新的工作表)
最后,可以通过快捷图表修饰工具条对其修饰,亦可以通过图表选项(在菜单“图表—图表选项”或在图表区域单击右键选择“图表选项”)
如果我们在第一步时选择图表类型时选择饼图(或其它如条形图等),以下几个步骤完全相同,我们则可以得到以下的饼图(或其它如条形图等)。
最后,可以通过快捷图表修饰工具条对其修饰,亦可以通过图表选项(在菜单“图表—图表选项”或在图表区域单击右键选择“图表选项”),包括填加标题、显示图例、选择显示数据标志的方式。
注意:在图表制作过程中,由于EXCEL本身有智能化的功能,其图表的数据区域、数轴一般会自动选择,如果我们发现自动选择有错误,则一定进行修改,否则所显示的图表不能清晰反映数据的分布特征,造成阅读困难。
第二节:定量数据的图形描述
于定量数据而言,条形图、饼图、直方图、折线图、散点图是都可以反映数据的分布特征。
首先,介绍以下图表组成:
下面通过两个实例说明:
一、 根据分组资料进行制图:
例:我们统计了一个班级30名学生的英语考试成绩,其分组表如下
步骤一:单击图表向导,选择柱形图(其它条形图、饼图亦可),点击下一步
步骤二:选择数据区域、定义分类轴,点击下一步
步骤三:定义图表选项,点击下一步
步骤四:选择图表保存位置,点击完成
最后,得到如下图形:
第八章 方差分析(ANOVA)
方差分析也称变异数分析或F检验,由英国著名统计学家R.A.FISHER推导建立。方差分析是一种快捷有效的统计分析方法,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否具有统计意义。其内容包括单因素方差分析和双因素方差分析。方差分析的基本思想是:通过样本数
据不同来源的变异分析,确定可控因素对研究结果的影响力。进行方差分析的样本要求是彼此独立、方差相等并来自正态分布的随机样本。
8.1 单因素方差分析
单因素方差分析的基本步骤包括:建立假设、确定显著性水平α、计算统计量F和统计决策等(见8.1框图)。
图8.1 方差分析流程图
8.1.1数据准备
某汽车制造商试图了解四种不同电话频率的营销效果。随机抽取32名销售代表并随机的指定实行四种计划,通过6个月的试验,获得以下销售数据(见表
8.1),试检验这四种电话营销方式的效果是否存在显著差异?(显著性水平α=0.05)。
表8.1 四种电话计划效率表
8.1.2统计分析
ANOVA统计检验的步骤如下:
1、 在Excel工作表中输入表8.1所示的数据和标志;
2、 选择工具栏中的数据分析,弹出如图8. 2所示数据分析对话框;
图8.2 数据分析对话框
3、 选择单因素方差分析并确定,易得8.3对话框图。当光标在在对话框输入区域跳动时选择单元A2:D9数据,根据题意确定显著性水平为0.05,并选择空白单元A13:C15为结果显示区域。
图8.3 单因素方差分析对话框
4、 单击8.3对话框图中的确定健,可得到统计分析结果(表8. 2)。
1.3结果解释
表8. 2的ANOVA分析概括了统计检验的过程和结果:32名代表销售记录的总体变异(SST)缘于组间变化(SSB)和组内变化(SSW)。MS是总体方差的两个估计值,通过SS除以适当的自由度(df)计算获得,统计量F是两个均方差估计(MS)的比值。
根据方差检验的理论,如果虚假设为真(即四个总体均值相等),则统计量F比值应趋近于1;若一个或多个总体均值与其他存在显著差异,组间差异明显,统计量F值应显著大于1。判断原则如下:
(1) 判决法:若F统计量值大于F crit临界值, 则表示存在显著差异;若F统计量值小于F crit临界值,则表示无明显差异。
(2) 报告法:若P- value值小于显著性水平α,则表示存在显著差异;若P- value值大于显著性水平α,则表示无明显差异。 借助以上判别标准,通过比较分析可以发现,案例中四种不同的电话频率访问计划对销售效果无显著影响。值得说明的是,对观察值数据不等的样本同样可以借助于Excel中单因素方差分析方法进行检验。
8.2 双因素方差分析
双因素方差分析是检验两个因素是否对实验结果产生影响或交互影响的分析方法,包括无重复的双因素方差分析和可重复的双因素方差分析两种。其分析方法和步骤与单因素方差分析基本一致,简要说明如下:
8.2.1无重复的双因素方差分析
进行双因素方差分析的目的,是要检验两个因素对试验结果有无影响。如果对两个因素的每一个水平组合只进行一次试验并据此进行检验,即为无重复的双因素方差分析。
对上例稍作调整,若32名销售代表六个月的销售业绩分别根据四种电话营销方案以及不同街区进行分组,则可以获得表8.3所示的一组数据。
借助数据分析工具,选择方差分析中的无重复双因素分析方法,输入相关数据,确定输出区域并点击“确定”即可得到检验结果如表8.4(假设显著性水平不变)。
结果解释:因为统计量F行=52.6379>临界值F crit=2.4876,所以不同的电话营销方案对各街区的销售效果有显著影响;由于统计量F列=26.4596>临界值F crit=3.0725,因此各个街区之间的销售效果存在明显差异。显然,报告法也可以得到同样的检验结果。
表8.3 无重复数据双因素方差分析
表8.4 无重复双因素方差分析检验结果输出表
SUMMARY 行 1 行 2 行 3 行 4 行
计数 4 4 4 4 4
求和 109 147 147 150 155
平均 27.25 36.75 36.7
5 37.50 38.7
方差 8.2500 11.583 6.91677 9.6667 9.58
5 行 6 行 7 行 8 列 1 列 2 列 3 列 4 差异源 行 列 误差 总计
4 4 4 8 8 8 8
158 171 181 298 332 281 307
5 39.50 42.75 45.25 37.25 41.50 35.125 38.375
MS 112.4821 56.54167 2.136905
33 9.0000 4.9167 11.5833
25.0714 30.5714 33.5536 29.6964
P-value 6.7E-12 2.5E-07
F crit 2.4876 3.0725
SS 787.375 169.625 44.875 1001.875
df 7 3 21 31
F 52.6379 26.4596
8.2.2可重复的双因素方差分析
如果要考察两个因素之间是否存在交互影响,则需要对两个因素各种水平的组合进行重复试验。
案例:某汽车调查公司试图了解三种品牌汽车在不同车速下的油耗。经四次重复实验,得到以下一组数据(表8.5)。
试在显著性水平α为0.05条件下检验: (1)三种品牌之间的油耗是否存在差异? (2)汽车对耗油量是否有影响?
(3)汽车品牌与行驶速度之间是否存在交互影响? 操作步骤如前:
选择工具栏
选择数据分析
选择双因素分析
确定数据输入区 域、显示区域和α
选择确定即可 获得建议结果
进行双因素方差分析时必须注意,在选取数据区域时应该包含标志栏(表
8.6中的列A和行2数据),因此数据区域应为A2:18,否则分析结果不正确。
表8.6 数据输入及输出区域的确定
选择可重复双因素方差分析对话框中的确定键,就可获得统计分析结果。
我们仅列出简化表8.7:
方差分析
总计
446.2
6
47
通过F统计量与对应临界值的比较分析可以得到以下结果:汽车品牌和行驶速度对油耗均有显著影响,而两者之间则并无交互影响。
第九章 相关回归分析(Regression and Correlation) 相关分析(correlation analysis)是研究变量之间关联强度或一致程度的统计分析方法,可分为单相关和复相关两种基本分析方法。相关系数是测定相关强度的重要指标。
回归分析方法则是通过经济现象的相关分析,建立被解释变量(因变量)和解释变量(自变量)之间的统计模型,以研究各变量之间彼此作用和影响的关系。研究“一因一果”,即一个自变量(解释变量)与一个应变量(被解释变量)的回归分析称为一元回归分析;研究“多因一果”,即多个自变量与一个应变量的回归分析称为多元回归分析。此外,回归分析中,又依据描述自变量与应变量之间因果关系的函数表达式分为线性回归分析和非线性回归分析。线性回归分析是
最基本的分析方法,遇到非线性问题通常可以借助数学手段化为线性回归问题处理。回归分析必须满足变量的独立性、分布的正态性、方差齐次性和无自相关性等条件。
9.1 一元线性回归分析
一元线性回归分析是用于描述两变量之间平均关系的线性方程。如果观察值数据在散点图中大致分布于一条直线上下,则可以考虑拟合一元线性回归模型。
案例:某市房产公司通过市场调查,获得以下一组关于住宅居住面积(平方英尺,SqFt)与销售价格(千美元,Price)的数据。
图9.1 居住面积与销售价格散点图
通过分析发现,房价高低基本依赖于住宅居住面积,所以售价为依赖变量而平方英尺面积为解释变量。为了检验两者的依存程度,可以进行回归分析。基本步骤为:
(1) 打开工具栏,选择“数据分析”中的“回归”分析方法,分别输入相应数据(显著性水平为0.05),即可出现如图9.2所示的对话框;
图9.2 回归模型选项对话框
(2) 选择对话框中的“确定”键,可以获得表9.1和表9.2所示的输出结果;
表9.1 回归结果输出表
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R
2
0.8147(相关系数) 0.6637(测定系数) 0.6378(修正测定系数)
标准误差 观测值 方差分析
3.2378(估计标准误差) 15
Significance
df
SS 268.90
回归分析 残差 总计
1 13 14
26 136.28405.18
4 标准误
Coefficients
18.7
Intercept X Variable 1
895 0.02101
差 3.8686
59 0.0041
t Stat 4.857 5.06
P-value 0.00031 0.00022
0.0120482 10.431739 Lower 95%
Upper 95% 27.147196 0.0299723
下限 95.0% 10.431739 0.0120482
上限 95.0% 27.14719557 0.029972314
MS 268.9 10.4
F 25.651
0.0002168
F
14 83
484 47
表9.2 残差分析表
(3) 结果解释:
根据表9.1和表9.2中各种数值,可得到趋势模型为:
Price18.78950.02101SqFt
拟合度评价:相关系数r=0.8147,表明价格与面积呈高度相关关系; 测定系数r2=0.6637,说明售价中的66.37%的变化可以用居住面积通过线性模型来解释;估计标准误差Se=3.2378,用以说明回归方程代表性的好坏。
统计检验:统计量tb=5.0647>t0.05/2(13)=2.160,表示回归系数与零存在显著差异;统计量F=25.651>Fα(1,13)=4.67 ,说明回归模型有效。
9.2 多元线性回归分析
上小节用简单线性回归模型研究了15个样本的住宅面积与售价的关系,标准误差为3238,测定系数是66.37%,售价的变化66%左右可以通过居住面积得以解释;而售价更多的变化必须用更多的变量来解释。
多元回归是表达一个因变量与两个或两个以上的自变量之间的线性依存关系的回归模型。上例中如果在面积的基础上再考虑为财产税收目而进行的事先评估因素,还可以改善拟合效果。研究售价与面积和评估两个解释变量并据此建立回归模型,这种分析即为多元回归分析。
(1) 数据建立:类似于一元线性回归模型,合理安排解释和被解释变量,从工具栏中选择“数据分析”并确定,在输入和输出区域分别选择数据,设显著性水平为0.05,容易得到图9.3 。
图9.3 多元回归对话框
(2) 结果输出
(3) 统计解释
9.3 非线性回归分析
《EXCEL在统计学中的应用》
第一章 EXCEL简介
在统计数据处理中,EXCEL是相对操作比较简单也比较容易得到的软件。对于一般的统计分析其功能也相对全面,因此我们想就EXCEL在统计工作中的应用显见要做一些介绍,在以后的章节将分别详细介绍。
一、 功能简介
EXCEL在统计分析中主要用到以下几个功能:统计制表、统计制图、描述统计、统计分析计算。
(一) 制表、制图
(二) 分析工具库
在EXCEL中有一个统计分析工具库,当我们运行工具---加载宏后,在工具下拉菜单下则会出现“数据分析”子菜单,点击它可以完成以下统计计算,见图1-1。
(三) EXCEL公式和统计函数
EXCEL公式和统计函数的内容我们单独分一长介绍。
第二章 EXCEL公式和统计函数
Excel具有强大的计算功能。它不但能利用公式进行简单的代数运算,而且能分析复杂的数学模型。它的数学、统计、财务等10类300多种函数 (预定义的内装公式),可以直接用于计算。它可以使用数组公式同时进行多重计算,并得 出一个或多个结果。本章根据统计计算的要求,重点讲述在Excel中如何使用公式和函数。
第一节 公式概述
公式是在工作表中对数据进行分析计算的等式。公式的计算范围不仅限于本工作表的数值,还可以包括同一工作簿中不同工作表的数值,乃至其他工作簿中工作表的数值。公式的内容包括运算项(元素)和运算符。运算项可以是数值,
也可以是单元格或单元格区域的引用,或单元格的标志和名称,还可以是工作表函数。这些运算项的具体内容将在后面分别详述,本节先对公式的运算符、运算顺序、输入公式、编辑公式等作一简介。
一、公式的运算符
公式的运算符有以下四种类型。(一)算术运算符:包括+、-、*(乘)、/(除)、%、 ^(乘方)。遇有负数可在前面加-号,或用括号表示。%和前面的数字连在一起作为一个数值处理,例如5%,系统将自动转换为0.05计算。
(二)比较运算符:包括;、>、=(大于或等于)、(不等于)。
比较运算符可用于比较两个数值,其运算结果产生逻辑值TRUE或FALSE.。例如,对公式:A2>100进行运算,结果如出现TRUE,表示公式成立,A2真的大于100;如出现FALSE,则表示公式不能成立,A2不大于100。
(三)文字运算符:连字符&。Excel不仅能进行数值运算,而且能进行文字值(文字型数据)的运算。利用连字符&,可以把一个或多个文字值连接起来,求得一个连续的文字值。例如:公式:“一季度”&“销售额”,即把“一季度”和“销售额”两个文字值连接起来,成为“一季度销售额”。如果一季度所在的单元格为A3,还可以将公式改为;A3&“销售额”,即把单元格和文字值连接起来。但要注意:文字值必须加双引号,以便识别。
(四)引用运算符:在公式中如要引用单元格或单元格区域的地址(行列号)进行运算,必须加引用运算符。引用运算符有三种。一是联合运算符,以逗号(,)表示。例如:公式:SUM(B3,B4,B5,B6,B7),表明要将B3、B4、B5、B6、B7五个单元格的数值相加求得合计。式中:SUM是求和函数,括号内是函数的参数,五个单元格之间要用逗号隔开。二是区域运算符,以冒号(:)表示。例如:、公式:SUM(B3:B7),表明要把B3至B7单元空格表示。例如:公式:SUM(B3:B5 A4:C4),表明竖向B3:B5和横向A4:C4两个交叉区域的数值相加求和,中间要用空格表示交叉,交叉处的单元格B4同时从属于两个区域的引用。交叉运算符使用较少。
二、公式的运算顺序
工作表中的公式是按照一定的顺序进行计算的,这种顺序可称之为语法。按照语法的要求,公式必须从:号开始,后面是参加计算的运算项和运算符。在各类运算符中,首先运行引用运算符,其次运行算术运算符,再其次运行文字运算符和比较运算符。其中,算术运算符的计算顺序是:负数-、%、 ^、*和/、+和-。例如=5+2*3,首先计算2*3=6,然后计算5+6=11。如要提前计算5+2,需用括号将其括起来,公式改为:(5+2)*3,计算结果为21。同一级的运算符如*和/,按从左到右的顺序进行计算:如有需要提前计算的部分,也要用括号括起来。
三、公式中数值的转换
在公式中,各种运算符都要求有一定类型的数据与之相适应。如果输入的数据类型不符合要求,有些将自动转换为可用的类型,有些则不能计算。举例如下:
[例]公式:“1”+“2”。式中使用+号,其运算项应是数字;现在1和2带有双引号,表明是文字型数据。但系统能自动将其转换为数字进行计算,计算结果为3。
[例]公式=10-“$4.00”。式中$4.00是文字型数据;但系统不考虑其货
币符号,转换为数字计算,计算结果为6。
[例]公式=“98-7-1”-“98-5-25”。式中是两个表示日期的数值,要求计算二者之间相差的天数,系统可将其转换为内置的序列数然后计算,计算结果为37天。
[例]公式=SQRT(“8+1”)。式中$QRT是求平方根函数,括号内的参数“8+1”格式不对,不能转换为数字,屏幕显示出错信息#VALUE!。如果把参数改为“9”或“8”+“1”,则可转换为数字计算,求得结果为3。
四、输入公式
比较简单的公式,可直接在单元格中输入。首先单击待输入公式的单元格,然后输入:号和公式的内容(窗口上方编辑栏中同时显示公式)。输入完毕回车确认,计算结果即自动记入该单元格内,编辑栏中的公式消失。如要再查看公式内容,可双击该单元格,公式即重复出现:再回车,又返回计算结果。
比较复杂的公式,最好在编辑栏中输入。首先也要选定待输入公式的单元格,然后单 击编辑栏中的“编辑公式”按钮(:),其右侧框中即出现一个:号(同时在其左侧出现“输入”按钮√和“取消”按钮X;还在编辑栏下方弹出计算结果显示框,框的右端并列“确定”和“取消”两个按钮),用户可在:后面输入公式,输入终了,计算结果即显示在编辑栏下的显示框中。再回车确认,或按“确定”按钮、或按“输入”按钮,均可将计算结果记入选定的单元格内。
在公式中如需使用函数,可单击编辑栏左端框旁的向下箭头,从弹出的常用函数列表中选定所需要的函数,即出现该函数的对话框(帮助信息称“公式选项板”)。在对话框上部参数框中输入必要的参数,对话框底部即显示出计算结果。再回车确认,计算结果即记入选定的单元格内。如果常用函数列表中没有所需要的函数,可单击“其他函数”项,屏幕弹出“粘贴函数”对话框,再从中选择所需要的函数。
输入数组公式与输入单值公式方法基本相同。首先单击待输入公式的单元格,如要求给出多个结果需单击待输入公式的单元格区域;然后输入公式,系统将自动为公式加上大括号
五、编辑公式
如要修改公式,需先单击包含待修改公式的单元格,.然后在编辑栏中进行修改,修改后回车确认。公式中如果引用了单元格行列号,将会自动按修改后的行列号重新计算,得出新的结果。如要修改公式中的函数,必须同时修改函数的参数。修改数组公式,可单击编辑栏,大括号自动消失;修改后按Ctrl+Shift+Enter组合键结束操作。
如要移动公式,也需先单击包含待移动公式的单元格,然后将鼠标指针指向选定区域的边框,按住鼠标左键将其拖至目标区域左上角的单元格,放开鼠标,即替换了目标区域的全部数据。复制公式与移动公式操作基本相同,只在拖动选定区域时需按住Ctrl键。应当指出,移动或复制公式,需从“工具”菜单的“选项”中选择“视图”卡,在“窗口选项”下单击“公式”选项。还需指出,移动公式单元格引用不改变;复制公式,单元格绝对引用
也不改变,但单元格相对引用将会改变。关于绝对引用和相对引用的含义下节详述。
删除公式也要先单击包含待删除公式的单元格,然后按Delete键即可删除。
如要删除
数组公式,需先单击数组区域中任一单元格,然后在“编辑”菜单中选择“定位” 命令,
按下“定位条件”按钮,从其对话框中选择“当前数组”项,再按Delete键删除。
六、公式的出错提示
如果公式不能正确算出结果,系统将会显示一个错误值。有时公式引用韵单元格有错误,
也会使公式产生错误。现将各项错误值的涵义和常见的错误简述如下。
(一)错误值的涵义
·#####! 输入或计算结果的数值太长,单元格容纳不下。
·#VALUE! 使用了错误的参数,或运算对象的类型不对。
·#DIV/0! 公式中除数为0,或引用了空单元格或包含0值的单元格。 · #NAME? 公式中使用了不能识别的单元格名称。
·#N/A 公式或函数中没有可用的数值。 .
·#REF! 单元格引用无效。
· #NUM! 公式或函数中某一数字有问题。
· #NULL! 对两个不相交的单元格区域引用使用了交叉引用运算符(空格)。 .
-如要了解各项错误值产生的原因和处理方法,可单击“帮助”菜单中的“创建公式和审核工作表”,从中选择“公式与错误值疑难解答”。
(二)常见错误 ,
公式可能出现的错误很多,常见的主要有以下几项。
1.圆括号()未成对出现,二者缺一。
2.引用单元格区域使用了不正确的运算符,应使用冒号(:) 。
3.缺少必选的参数,或输入了多余的参数。
4.在函数中使用嵌套函数不符合要求。
5.引用工作簿或工作表的名称中含有非字母字符,但未加单引号。
6.外部引用缺少工作簿名称和路径。
7.公式中输入数字不应加格式,如$1,000,应输入1000,不应带货币符号和千分位点。
第二节 公式中单元格的引用
一、引用的作用和常设形式:
公式中“引用”的作用在于标出工作表上参加计算的单元格或单元格区域,指明公式计算用数据的位置。一个公式可以引用工作表上不同单元格的数据,多个公式也可以引用同 一单元格数据;还可以引用同一工作簿中不同i作表的数据,或是不同工作簿中工作表的数据,乃至其他应用程序的数据。引用其他工作簿的数据叫做外部引用,引用其他应用程序的数据叫做远程引用。 引用有A1和R1C1两种表现形式,常设为A1形式(默认形式)。这种形式用英文字母表示列,用数字表示行。例如:
要引用A列5行交叉处的单元格,可输入A5。
要引用A列5行至10行的单元格区域,可输入A5:A10(中间的冒号表示起止范围)。
要引用A列5行至E列5行的单元格区域,可输入A5:E5。
要引用5行各列所有的单元格,可输入5:5。
要引用5行至10行各列所有的单元格,可输入5:10。
要引用C列各行所有的单元格,可输入C:C。
要引用C列至E列各行所有的单元格,可输入C:E。
在公式中利用单元格引用进行计算,可以迅速简便地得出结果。举例说明如下:
上表,单元格B5、C5、D5、E5、E2、E3、E4都需计算合计数。例如:要计算B5单元格的合计数,需先选定该单元格,然后单击编辑栏的=号,再单击编辑栏左端函数框向下的箭头,从弹出的函数列表中选择求和函数SUM,在SUM对话框的Numberl(参数1)框中输入单元格引用B2:B4,经回车确认,其计算结果1368即自动记入该单元格内。其他各单元格的合计数均可照此计算。不仅如此,如果将鼠标指针移至该单元格右下角的填充柄上,当指针变成+字形时按住鼠标左键向右拖曳,至E5单元格放开鼠标,可以一次求得C5、D5、E5的合计数(实际是移动公式的一种方法)。E2至E4单元格的合计数也可照此求得。
二、绝对引用和相对引用
绝对引用是指当复制公式时,公式中引用的单元格位置不变;相对引用是指当复制公式时,公式中引用的单元格位置将随之改变为新的位置。在公式中,一般使用相对引用;如果要求复制公式时引用的单元格位置不变,则需使用绝对引用。使用绝对引用的好处是:可使存放固定数值(如税率、利率等)的单元格位置不致在复制公式时发生变动。在A1形式下,如要使用绝对引用,需在列标和行号前面加上美元符号$。例如:A5,需改为$A$5。
引用的另一种形式R1C1,也可以用于绝对引用和相对引用。要使用R1C1形式,需在“工具”菜单中单击“选项”,从其对话框中选择“常规”选项卡,在选项卡的“设置”项下选择“R1CI引用样式”(前面方框中出现√号)。R1C1形式与Al形式不同的是:引用单元格的行和列都用数字表示,行号前加字母R,列号前加字母C;而且R1C1本身是绝对引用,相当于A1形式下的$ASl。要在R1C1形式下使用相对引用,需给行号和列号加上方
括号[ ]。举例如下:
引用R表示对当前行的绝对引用。
引用C表示对当前列的绝对引用。
引用R2C2 表示对2行2列单元格的绝对引用。
引用R[2]C[2] 表示对当前行向下第2行、当前列向右第2列单元格的相对引用。
引用R[-2]C 表示对当前列向上第2行单元格的相对引用(-号表示逆向)。
引用RC[-2] 表明对当前行向左第2列单元格的相对引用。
引用R[-2] 表明对当前行向上第2行整行单元格区域的相对引用。 此外,在复制公式时,如果只要求引用单元格的行保持不变(列可以变),或者只要求引用单元格的列保持不变(行可以变),就需要使用混合引用。即在一次引用中,既有绝对引用,又有相对引用。例如:在A1形式下引用$A5,表明是对A列的绝对引用和对5行的相对引用;引用A$5,表明是对5行的绝对引用和对A列的相对引用。在R1C1形式下引用R[-2]C2,表明是对当前行向上第2行的相对引用和对当前列向右第2列的绝对引用;
引用RC[-2],表明是对当前行的绝对引用和对当前列向左第2列的相对引用。
三、三维引用和外部引用
当需要引用一个工作簿中多个工作表的同一单元格或单元格区域时,可使用多维引用。
例如:某商场的“销售额”工作簿中包含12个月份的“销售额”工作表,现在要汇总全年的销售额,就需要使用三维引用。假定要在汇总表的B2单元格中记入销售额全年总计,首先要将该单元格击活,然后输入“=SUM(Sheetl:Sheetl2!A2)”。式中:Sheetl:Sheetl2是1-12月的工作表标签,!号将工作表和单元格隔开,A2是销售额所在的单元格。输入完毕回车确认,即将计算结果记入B2单元格内。
由于三维引用涉及到多个工作表,如果工作表发生变动,就必然会影响三维引用。下面以公式“=SUM(Sheet3:Sheet6!B2:B5)”为例说明其影响。
如果在引用工作表范围(Sheet 3:Sheet 6)中插入另一工作表,则该工作表单元格区域(B2:B5)的数值也要计算在内。
如果在引用工作表范围中删除某一工作表,则该工作表单元格区域的数值也要被去掉。
如果把引用工作表范围中的某一工作表移至范围以外,则该工作表单元格区域的数值也会被删除。
如果把引用范围起止的工作表(Sheet3或Sheet6)移至工作簿的其他位置,系统将自动调整引用范围,包含新的起止位置中间的所有工作表。
引用其他工作簿数据的外部引用,其操作方法和三维引用基本相同,只是在输入公式时需依次输入其他工作簿的名称、工作表的名称、引用的单元格或单元格区域。上例,如果是五个单位的全年销售额,分别存在工作簿Bookl至Book5的工作表Sheetl的A2单元格中,可在当前工作表的A1单元格中输入“=SUM([Bookl]Sheetl:[Book5]Sheetl!A2)”,回车确认,即将五个单位的全年销售额汇总到一起。
四、公式的循环引用 ·
在公式中直接或间接引用了自身所在的单元格,叫做循环引用。出现循环引用有两种情况。一种是输入公式错误,当回车确认时,系统给出提示,指出“此公式不能计算”。此时如按提示单击“确定”按钮,系统将自动显示“循环引用”工具栏,并指出产生循环引用的单元格(该单元格中出现一个蓝色圆点,屏幕底行状态栏显示“循环”二字及该单元格的位置),可重新输入正确公式,消除循环引用。另一种情况是有些公式需要循环引用,可使用“迭代法”算出结果。要使用迭代法求解循环引用,其步骤如下:
首先,单击“工具”菜单中的“选项” ,在弹出的对话框中打开“重新计算”选项卡。
其次,在选项卡的左侧选定“反复操作”项(前面出现√号),回车确认,即可按默认的最多迭代次数100和最大误差0.001进行运算(默认值如不合适可以改变)。
最后,当迭代次数和误差有一项达到要求时,即自动停止运算,显示出计算结果。
兹再举一简例说明求解循环引用。假定A1单元格的数值为2000,b1单元格的公式为=Al-C1,C1单元格的公式为=B1*0.3,两个公式互相引用。现按
上述方法反复操作,即可求得结果,C1单元格为461.5384,B1单元格为1538.4616。
第四节 使用函数
如前所述,函数是预先确定含义的内装公式。函数可以在公式中使用,也可以单独使用。
使用函数可以简化计算、提高效率、减少差错,故在工作中应尽量利用函数。
一、可用子统计的函数
Excel为用户提供了数学和三角函数、统计函数、数据库函数、财务函数、工程函数、
逻辑函数、文本函数、日期和时间函数、信息函数、查找和引用函数等10类300多种函数,
可以满足多方面的计算要求。其中,以统计函数为最多,达78种;此外还有14种数据库函
数可从数据库提取数据进行计算,以及在统计中经常使用的数学、统计函数20种,合计112种。
现将这些函数列表如下:
函数名称功能简介
一、统计函数
1.用于数据整理的函数
FREQUENCY 以垂直数组形式求频率分布
2.用于描述统计的函数
MODE 求‘组数据的众数
MEDIAN 求一组数据的中位数
AVERAGE 求一组数据的均值
AVERAGEA 求数据清单中数据的均值
HARMEAN 求调和平均数
GEOMEAN 求几何平均数
TRIMMEAN 求去掉最大值和最小值的平均数
MAX 求数据清单中的最大值
MAXA 求数据清单中包含逻辑值和字符串的最大值
MIN 求数据清单中的最小值
MINA 求数据清单中包含逻辑值和字符串的最小值
LARGE 求一组数据中第K个最大值
SMALL 求一组数据中第K个最小值 ,
QUARTlLE 求一组数据的四分位差
AVEDEV 求样本数据与其均值的平均离差
DEVSQ 求样本数据与其均值离差的平方和
STDEV 求样本标准差
STDEVA 求包含逻辑值和字符串的样本标准差
STDEVP 求总体标准差
STDEVPA 求包含逻辑值和字符串的总体标准差
VAR 求样本方差
VARA 求包含逻辑值和字符串的样本方差
VARP 求总体方差
VARPA 求包含逻辑值和字符串的总体方差
KURT 求一组数据的峰度
SKEW 求一组数据的偏度
用于概率分布的函数
B1NOMDIST 求二项分布的概率
NEGBINOMDIST 求负二项分布
CRITBINOM 求累积二项分布大于或等于临界值的最小值
PISSON 求泊松分布
NORMDIST 求非标准正态分布的累积函数
NORMINV 求非标准正态分布累积函数的逆函数
NORMSDIST 求标准正态分布的累积函数
NORMSINV 求标准正态分布累积函数的逆函数
STANDARDIZE 求Z分布的正态化数值 ·
LOGNORMDIST 求对数正态分布的累积函数
LOGINV 求对数正态分布累积函数的逆函数
HYPGEOMSIST 求超几何分布
BETADIST 求ß分布的累积函数
BETAINV 求ß分布累积函数的逆函数
GAMMADIST 求ν分布的累积函数
GAMMAINV 求ν分布累积函数的逆函数
GAMMALN 求ν分布累积函数的自然对数
EXPONDIST 求指数分布
WEIBULL 求韦伯分布
PROB 求指定区域内事件对应概率之和
PERMUT 求从数据集合中选取若干对象的排列数
4.用于参数估计的函数
CONFIDENCE 求总体均值的置信区间
5.用于假设检验的函数
CHIDIST 求七’分布的单尾概率
CHIINV 求刀’分布单尾概率的逆函数
CHITEST 求七’分布的统计量和相应的自由度
ZTEST 求2检验的双尾概率
TDIST 求/分布
TINV 求/分布的逆函数
TTEST 求/分布相关的概率
FDlST 求9分布
FINV 求F分布的逆函数
FTEST 求F检验的单尾概率
6.用于方差分析的函数
COVRB 求协方差
7.用于相关和回归的函数
CORREL 求相关系数
PEARSON 求皮尔逊乘积矩相关系数
RSQ 求皮尔逊乘积矩相关系数的平方
FISHER 求费雪变换值(用于相关系数的假设检验)
FISHERIVE 求费雪变换的逆函数
LINEST 建立直线方程
INTERCEPT 求直线方程的截距
SLOPE 求直线方程的斜率
FORECAST 求线性趋势值(预测值)
TREND 求线性趋势值(预测值)
STEYX 求趋势值的标准误差
LOGEST 建立指数曲线方程
GROWTH 求指数曲线趋势值(预测值)
8.其他统计函数
COUNT 求数组中数据的个数(只计算数字型数据)
COUNTA 求数组中数据的个数(包含逻辑值、文本值等)
RANK 求某一数值在数组中的排位
PERCENTRANK 求某一数值的百分比排位
PERCENTILE 求数据区域中第尺个百分比数据
二、数据库函数
DCOUNT 计算数据库中符合指定条件并含有数字的单元格数
DCOUNTA 计算数据库中符合指定条件的非空单元格数
DGET 从数据库中抽取一个符合指定条件的记录
SUBTOTAL 将数据清单、数据序列和数据库中的数据分类汇总
DSUM 计算数据库中符合指定条件的记录字段数值之和
DPRODUCT 计算数据库中符合指定条件的记录字段数值的乘积
DAVERAGE 计算数据库中指定项目的平均数
DMAX 从数据库指定项目中求最大值
DMIN 从数据库指定项目中求最小值
DSTDEV 以数据库中指定项目为样本求标准差
DSTDEVP 以数据库中指定项目为总体求标准差
DVAR 以数据库中指定项目为样本求方差
DVARP 以数据库中指定项目为总体求方差
SOLREQUEST 链接外部数据源,从中查找数据,以数组形式求得结果,不编程
三、统计中常用的数学函数
SUM 参数求和
SUMIF 将符合指定条件的单元格相加
PRODUCT 参数相乘
QUOTIENT 求两数相除的整数部分
MOD 求两数相除的余数
POWER 求数值的乘幂
SQRT 求平方根
RAND 求0~1之间的随机数
RANDBETWEEN 求指定的两数之间的随机数
COMBIN 求指定对象数目的组合数
COUNTIF 求符合指定条件区域的非空单元格数
FACT 求某数的阶乘
LN 求某数的自然对数
LOG 求某数以指定数为底的对数
LOGl0 求某数以10为底的对数
SUMPRODUCT 求两组对应值的乘积之和∑xY
SUMSQ 求参数的平方和 ∑X2,∑y2
SUMXMY2 求两数组对应值之差的平方和 ∑(x-y)2
SUMX2MY2 求两数组对应值平方差之和 ∑(x2-y2)
SUMX2PY2 求两数组对应值平方和之和 ∑(x2+y2)
第三章 统计数据的整理与显示
统计数据的整理即就是统计分组和排序,如何将分组以后的数据表示出来,使其一目了然的反应数据的分布状况,EXCEL可以帮助我们完成这些工作。甚至我们可以利用EXCEL提供的分析工具---直方图,直接让计算机帮助我们分组并将其分布特征展示出来。本章将通过几节内容介绍这些方法。
第一节 用EXCEL制表
在Office办公集成软件中,Word、Excel、Access都能制表:但各有不同特点和不同适用范围。Excel主要适用于包含复杂计算、统计分析、数据检索、排序和绘制统计图的表格。本文先举一实例简要说明Excel的制表过程,然后再系统地讲述Excel制表的各项功能。
上表操作过程简述如下:
(1)打开计算机,进入Excel后,整个窗口呈现出一个横竖线交插的大表。表的上端用A、B、C„„标明列号;表的左侧用1、2、3、„„标明行号(统计表横称行,竖称列或栏;由横竖线组成的长方格叫单元格;将列号和行号组合起来表示单元格的位置(地址),如A1、B2、C3、„„。这张大表就是Excel的操作区。区中;列数最多可达256列,行数可达16384行,组成的单元格数达16384X256个;但窗口只能显示8列、16行、128个单元格,其余部分需用垂直滚动条和水平滚动条上下左右滚动显示。
(二)由于操作区本身就是一张大表,所以无须另建表格,可以直接向表格中输入数据。但为操作方便起见,也可以先画出表的边框线。加边框线首先要选定操作对象,即给操作对象做上标记。上表,1'-4行是表头各栏,即指标名称;5~11行是各类型企业的指标数值;横向由A至P共16列。为此可将鼠标指针(空十字形)移至A1单元格(在表的左上角),然后按住鼠标左键斜向拖至P11单元格(在表的右下角。也可以按住Shift键用方向键移至p11单元格),拖过的区域即反白显示,表明已被选定。接着单击菜单栏的“格式”项,其下拉菜单中选择“单元格” ,在弹出的“单元格格式”对话框中一排列出数字、对齐、字体、边框、图案、保护6个选项卡,可从中选择“边框”卡,单击上边框、下边框、左边框、右边框和列间隔线五个按钮,回车确认,即显示出带边框的表式。为了把表头和指标数值隔开,还可以将鼠标指针移至A4单元格,然后按住鼠标左键向右拖至P4单元格(或按住shift键用右向键移至,P4单元格),在“格式”菜单中选择“单元格·”;再选择“边框”,单击下边框按钮,回车确认,即在表头和指标数值中间插入一条横表格线。
(三)表的轮廓确定后,可以一边输入数据,一边对表格进行必要的调整和修改。操作中需使用以下一些功能。
1不论进行何种操作,都必须首先选定操作对象。将鼠标指针移至某一单元格,单击鼠标左键,该单元格周围即出现一个方框,表明已被选定,成为当前活动的单元格(只有在当前活动的单元格中才能进行各项操作)。按住鼠标左键向选定的单元格上下左右拖动(或按住Shift键用方向键移动),可将相邻的单元格一起选定。先选定一行,然后按住鼠标左键上下拖动(或用方向键移动),可选定多行。先选定一列,然后按住鼠标左键向左右拖动(或用方向键移动),可选定多列。如要选定全表,可单击表的左上角行列相交处的空格。
2.操作区单元格列宽的默认值为8.38(单位是标准字符个数,2个标准字符的位置可容纳1个小四号汉字)。这与例中要求不符,需进行调整。调整的方法是首先选定要调整的列,然后从“格式”下拉菜单中单击“列”选项,再在“列”的子菜单中选择“列宽”,在“列宽"框中输入要调整的字符个数,回车确认,列宽即改变过来。上表A列需容纳16个汉字,可输入入32;I列需容纳4个汉字,与默认值接近,可以不变:M列需容纳5个汉字,可输入10;其余各列需容纳3个汉字,可输入6。
调整列宽还有一个简便方法,即将鼠标指针移至两个列号之间,当指针变成“中间两条竖线边两个反向箭头”形状时,按住左键向左拖动(缩小)或向右拖动(扩大),拖至需要的宽度放开鼠标,即可完成操作。此法最好先输入一些能决定列宽的数据,以之作为调整列宽的依据。
3.上表表头中有些单元格需要合并。例如:D、E、F列第一行“资本金”,G—P列第
一行“年末资产” ,以及下面的“流动资产”和“固定资产”,都需要将横向相连的若干单元格合并在一起。又如:由于表头占了4行位置,有的栏目需将竖向相连的2个、3个或4个单元格合并在一起。不论横向或竖向的合并,选定待合并的单元格后,都可以在“格式”下拉菜单中单击“单元格”选项,再从弹出的对话框中选择“对齐”卡,在屏幕左侧“文本控制”项下单击“合并单元格”项,回车确认,所选单元格即合并成一个大的方框。
4.单元格合并后往往缺少必要的框线,例如:上述“资本金”“年末资产”“流动资产” “固定资产”都没有下框线,可继续上项操作,在“格式”下拉菜单中选择“单元格”项,从弹出的对话框中选择"边框”卡,单击下边框按钮,回车确认,即添加出下边框线。
5.在合并后的单元格中输入数据,从水平方向来说可靠左、靠右、或居中,从垂直方向来说可靠上、靠下、或居中,这可以在设置“合并单元格”时一起设定。在“对齐”选项卡左侧“文本对齐”项下,有一个“水平对齐”框和一个“垂直对齐”框,用鼠标左键按住
框旁三角,从其下拉列表中选择需要的对齐方式,回车确认,即可达到要求(输入文字默认为靠左对齐,输入数字默认为靠右对齐)。此外,在合并后的单元格中,如果要输入的数据不止一行,还可以在“对齐”卡左侧“文本控制”项下选择“自动换行”项,待输满一行后即可自动转至下行。
6.要输入数据(包括文字和数值),需先进行光标定位。即将鼠标指针移至待输入数据的单元格,单击鼠标左键,使之成为当前活动的单元格,然后开始输入操作(双击鼠标左键,将出现一个直线形光标,用方向键移动光标,可确定输入的位置)。如要输入文字,还需选定所用的中文输入法,即将鼠标指针移至屏幕底行右端,单击“En”按钮.(En是“英语”)
一词的缩写,表明常设为英语输入状态),从“输入法”列表中选择自已惯
用的输入法,屏幕底行即出现该输入法的名称。上表输入开始,可先激活Al至A4的大单元格,如已设定“居中”“靠左”对齐,光标即停在单元格中部左侧,可输入“企业类型”四字,中间用适
量空格隔开。输入终了,如果按回车键,可将光标移至下行A 5单元格,继续输入“XX集团公司总计” :如果按右向一键,可将光标移至右列B1至B4大单元格,继续输入“企业单位数”。以下各行各列均可照此操作。在B、C、E、F、G、K、M、N、O、P各列中,都有己合并需输入二、三行文字的单元格,如未事先设定“自动换行”,可在输满一行后用A1t+回车键换行。F列输入完了后,屏幕上已看不到右边各列,需将鼠标指针移至水平滚动条右侧,连续单击右向三角形按钮,使右边各列左移,以便继续输入数据。
7.表中B、C两列需进行求和计算,此项操作最好是利用“格式”工具栏下面的编辑栏进行(其实以上各项操作也都可以利用编辑栏进行)。编辑栏左端显示当前活动单元格的位置;往右单击“:”可出现一个:号,;号后面可输入计算公式;在;号左面单击√按
钮可确认输入,单击X按钮可取消输入。例如;要计算企业单位数的总计,可先单击B5单元格,然后在编辑栏右侧输入公式“=B6+B7+B8+B9+B10+B11”,或输入“=SUM(B6:B11)”,按下√按钮,计算结果即自记入B5单元格内(公式中,:号必不可少。相加各项最好是用“单元格位置引用”,当修改某项数值时总计数将会随之改变。SUM是求和函数,“B6:B11”表示由B6至B11,(中间的冒号指明计算范围)。也可以先选定B6;B11单元格,然后单击“常用”工具栏右起第9个按钮∑(自动求和”符号),其总计数即自动记入B5单元格内。C5单元格总计数的计算方法与此相同。其余“资本金”的合计,“年末资产”的总计,以及“流动资产”和“固定资产”的合计,未列出数字,实际在工作中均可照此计算。
8.除以上各项外,还要给表格加上标题和必要的注释。上表实际操作时,可预留两行空行以备输入标题,即表格边线从第3行画起。现为说明方便起见未留空行,需再插入两个空行。其法首先单击1、2行的单元格将其击活,然后在“插入”菜单中单击“行”选项,表上即出现两个空行(行号下移两格,表从3行开始)。再按前述方法在“格式”菜单中单击“单元格”选项,利用“对齐”卡中“合并单元格”功能将两个空行合并,即可输入标题“财务指标汇总表
(一)”。又,为了说明上表因横向超过页宽需分两页打印,也可按上述方法在表下选定一个空行,输入注释。
9.最后不要忘记存盘,以备将来再用。存盘的方法可单击“常用”工具栏左起第一个按钮,或在“文件”下拉菜单中选择“另存为”项,在弹出的对话框顶端“保存位置”框中显示“My Documents”(意为“我的文件”,是C盘上的一个文件夹),在对话框底部“文件名”框中可输入对上表的命名(一般用1~8个英文字母)系统将自动加扩展名.XLS予以保存。
10,表格制成以后,有时还需进行一项额外操作。用Excel制作的表格,往往需要插入用Word编写的统计分析报告或统科学论文中,其最简单的方法是利用剪贴板功能。首先,在Excel中选定待复制的表格,从“编辑”下拉菜单中选择“复制”项,,将该表格暂存于
剪贴板上;然后退出Excel(如能进行多窗口操作也可以不退出),打开Word文件,将光标移至待复制Excel表格的位置,从“编辑”下拉菜单中选择“粘贴”项,即将表格复制过来。Excel表格复制到Word文件中,列宽、字体、·字号和各列指标数值一般不会改变:但表头部分的行高和格式可能发生变化,需用Word
制表功能加以调整,然后存为Word文档。
通过上述实例对Excel的制表过程已有初步了解,下面将分别讲述Excel在建立表格、编辑表格和表格格式化等方面的功能。
二 建立表格
如前所述,进入Excel后整个操作区就是一张大表,所以建立表格的操作主要是向表格中输入数据。输入数据的基本方法上节已经讲过,现再作些补充。
(一)在选定的区域内,如果沿行的方向输入数据,每个单元格输入完了后,可按Tab键或右向一键移至右侧的单元格继续输入:输入到区域的右边界时,光标将自动移至下一行开始处。如果沿列的方向输入,每个单元格输入完了后,可按回车键或向下的1键移至下一行继续输入;输入到区域的下边界时,光标将自动移至下一列的开始处。
(二)表格中如有要输入相同数据的若干单元格,可先按住Ctrl键逐一选定,然后在当前活动单元格中输入数据,再按Ctrl+回车键,即可完成操作。
(三)输入数字如果未事先设定数字格式,应注意以下几点:
输入负数,前面加“一”号,或用“()”括起来。 输入的数字如果带有小数点,必须将汉字输入法后面方框中的标点按钮“。,”切换成英文标点“.,” , 输入日期,年月日之间要用“/”或“-”隔开。例如:99年7月1日可输入7/1/99,或99—7—1。如要输入当天日期,可按Ctrl+分号“;”键。 输入时间,如采用12小时制,先在时间数字后面输入一个空格,然后如是上午再输入字母a,如是下午再输入字母p。如要输入当前时间,可按Ctrl+Shift+冒号“:”键。
输入分数,为避免与日期混淆,可在前面加0及空格。如:二分之一可输入“01/2”。 输入数字长度超过单元格列宽,将自动改为科学记数形式(科学记数的读法见第四节)。如仍超过列宽,将出现错误值“####!”,需靠调整列宽解决。
(四)输入数字如要带有相同位数的小数或尾0,可在“工具”下拉菜单中单击“选项”,再单击“编辑”选项卡,从弹出的对话框中选择“自动设置小数点”(前面方框中出现√号),在“位数”框中输入正数是设置小数位数,输入负数是设置尾0个数。在输入过程中如要暂时取消此项设置,可在输入数据后再键入一个小数点。
(五)如果某行、某列需输入有规律的序列数据,如:年度、季度、月份、星期、1234等,可在前两个单元格中输入前两个数据,然后用鼠标左键按住第二个单元格的“填充柄”(右下角的黑方块),拖曳到结束的单元格,序列数据将自动“填充”在相应的单元格中。如果是不便预置的序列如单位的人员名单等,还可以自定义序列。其法首先在“工具”下拉菜单中选择“选项”,从中选择“自定义序列”选项卡,在选项卡中部的“输入序列”表中逐一输入人员姓名,然后单击“添加”按钮,将名单添加到选项卡左侧的“自定义序列”列表中。当需要使用名单时,可在选定的单元格内输入名单的任意一项,然后用鼠标左键按住该单元格的填充柄拖曳至结束处,即自动填写出整个名单。“自定义序列”选项卡见图3-1
图3-1 自定义序列”选项卡
(六)利用Excel的“自动更正”功能,可将经常使用的词汇定义为一个短语,以后再输入此短语时,该功能可将其转换为原定义的词汇,从而提高输入效率。方法:工具自动更正,在弹出对话框的“替换”框中输入使用的短语,在“替换为”框中输入被定义的词汇;然后按下“添加”按钮,回车确认,输入的短语和被定义的词汇即列入下面的表中。
(七)为了防止输入数据出现错误,可以事先设置好数据格式,以便在输入过程中进行检查。方法,首先选定待输入数据的单元格区域。然后单击“数据”“有效数据”选项,在弹出的对话框中选择“设置”选项卡,再在“有效条件”项下单击“许可”框旁向下的三角,从其下拉列表中选择需要的项目。例如,选择“小数”或“整数”,选定后即出现“数据”“介于”“最小值”和“最大值”两个空框,可分别输入规定的上、下限数值,回车确认执行。如果输入的数值中有低于下限或高于上限的数值,按下Enter键就提示“输入值非法”。以后如果不再需要此项限制,可以打开“有效数据”对话框,将此项功能取消。
第三节:表格的编辑与修饰
表格的编辑与修饰一般包括:单元格内容的移动复制和清除;单元格、行或列的插入和删除;工作表的插入、删除和复制;行宽和列高的调整;字体、字号字形的选择;数字格式的选择;设置对齐方式;设置边框和底纹,这些操作在一般的EXCEL教材中均能见到,在此不用详细阐述。
第四章:EXCEL做图
在我们统计分析中常用的统计图有条形图、茎叶图、直方图、曲线图等待,这些图都可以在EXCEL完成。用图形描述数据的目的是对数据集的特征做出概括。本章将向你展示如何用EXCEL如何绘制能降数据集的性质传递出来的各种图形。
第一节 定性数据的图形描述
对于定性数据而言,条形图和饼图是用的最普遍的两种图形。这种图形显示了落入每一个定性类别中的观察值的多少(频数或频率)。下面我们根据调查的来的无锡使2003年12月份房屋销售套数数据用条形图反映其分布特征。
步骤一:在工具栏点击图表按纽(菜单“图表—图表类型)
步骤二:选择数据源
步骤三:填上图表标题、分类轴、数值轴
步骤四:选择图表保存位置
最后点击完成,将图表保存在当前数据工作表(或另存为新的工作表)
最后,可以通过快捷图表修饰工具条对其修饰,亦可以通过图表选项(在菜单“图表—图表选项”或在图表区域单击右键选择“图表选项”)
如果我们在第一步时选择图表类型时选择饼图(或其它如条形图等),以下几个步骤完全相同,我们则可以得到以下的饼图(或其它如条形图等)。
最后,可以通过快捷图表修饰工具条对其修饰,亦可以通过图表选项(在菜单“图表—图表选项”或在图表区域单击右键选择“图表选项”),包括填加标题、显示图例、选择显示数据标志的方式。
注意:在图表制作过程中,由于EXCEL本身有智能化的功能,其图表的数据区域、数轴一般会自动选择,如果我们发现自动选择有错误,则一定进行修改,否则所显示的图表不能清晰反映数据的分布特征,造成阅读困难。
第二节:定量数据的图形描述
于定量数据而言,条形图、饼图、直方图、折线图、散点图是都可以反映数据的分布特征。
首先,介绍以下图表组成:
下面通过两个实例说明:
一、 根据分组资料进行制图:
例:我们统计了一个班级30名学生的英语考试成绩,其分组表如下
步骤一:单击图表向导,选择柱形图(其它条形图、饼图亦可),点击下一步
步骤二:选择数据区域、定义分类轴,点击下一步
步骤三:定义图表选项,点击下一步
步骤四:选择图表保存位置,点击完成
最后,得到如下图形:
第八章 方差分析(ANOVA)
方差分析也称变异数分析或F检验,由英国著名统计学家R.A.FISHER推导建立。方差分析是一种快捷有效的统计分析方法,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否具有统计意义。其内容包括单因素方差分析和双因素方差分析。方差分析的基本思想是:通过样本数
据不同来源的变异分析,确定可控因素对研究结果的影响力。进行方差分析的样本要求是彼此独立、方差相等并来自正态分布的随机样本。
8.1 单因素方差分析
单因素方差分析的基本步骤包括:建立假设、确定显著性水平α、计算统计量F和统计决策等(见8.1框图)。
图8.1 方差分析流程图
8.1.1数据准备
某汽车制造商试图了解四种不同电话频率的营销效果。随机抽取32名销售代表并随机的指定实行四种计划,通过6个月的试验,获得以下销售数据(见表
8.1),试检验这四种电话营销方式的效果是否存在显著差异?(显著性水平α=0.05)。
表8.1 四种电话计划效率表
8.1.2统计分析
ANOVA统计检验的步骤如下:
1、 在Excel工作表中输入表8.1所示的数据和标志;
2、 选择工具栏中的数据分析,弹出如图8. 2所示数据分析对话框;
图8.2 数据分析对话框
3、 选择单因素方差分析并确定,易得8.3对话框图。当光标在在对话框输入区域跳动时选择单元A2:D9数据,根据题意确定显著性水平为0.05,并选择空白单元A13:C15为结果显示区域。
图8.3 单因素方差分析对话框
4、 单击8.3对话框图中的确定健,可得到统计分析结果(表8. 2)。
1.3结果解释
表8. 2的ANOVA分析概括了统计检验的过程和结果:32名代表销售记录的总体变异(SST)缘于组间变化(SSB)和组内变化(SSW)。MS是总体方差的两个估计值,通过SS除以适当的自由度(df)计算获得,统计量F是两个均方差估计(MS)的比值。
根据方差检验的理论,如果虚假设为真(即四个总体均值相等),则统计量F比值应趋近于1;若一个或多个总体均值与其他存在显著差异,组间差异明显,统计量F值应显著大于1。判断原则如下:
(1) 判决法:若F统计量值大于F crit临界值, 则表示存在显著差异;若F统计量值小于F crit临界值,则表示无明显差异。
(2) 报告法:若P- value值小于显著性水平α,则表示存在显著差异;若P- value值大于显著性水平α,则表示无明显差异。 借助以上判别标准,通过比较分析可以发现,案例中四种不同的电话频率访问计划对销售效果无显著影响。值得说明的是,对观察值数据不等的样本同样可以借助于Excel中单因素方差分析方法进行检验。
8.2 双因素方差分析
双因素方差分析是检验两个因素是否对实验结果产生影响或交互影响的分析方法,包括无重复的双因素方差分析和可重复的双因素方差分析两种。其分析方法和步骤与单因素方差分析基本一致,简要说明如下:
8.2.1无重复的双因素方差分析
进行双因素方差分析的目的,是要检验两个因素对试验结果有无影响。如果对两个因素的每一个水平组合只进行一次试验并据此进行检验,即为无重复的双因素方差分析。
对上例稍作调整,若32名销售代表六个月的销售业绩分别根据四种电话营销方案以及不同街区进行分组,则可以获得表8.3所示的一组数据。
借助数据分析工具,选择方差分析中的无重复双因素分析方法,输入相关数据,确定输出区域并点击“确定”即可得到检验结果如表8.4(假设显著性水平不变)。
结果解释:因为统计量F行=52.6379>临界值F crit=2.4876,所以不同的电话营销方案对各街区的销售效果有显著影响;由于统计量F列=26.4596>临界值F crit=3.0725,因此各个街区之间的销售效果存在明显差异。显然,报告法也可以得到同样的检验结果。
表8.3 无重复数据双因素方差分析
表8.4 无重复双因素方差分析检验结果输出表
SUMMARY 行 1 行 2 行 3 行 4 行
计数 4 4 4 4 4
求和 109 147 147 150 155
平均 27.25 36.75 36.7
5 37.50 38.7
方差 8.2500 11.583 6.91677 9.6667 9.58
5 行 6 行 7 行 8 列 1 列 2 列 3 列 4 差异源 行 列 误差 总计
4 4 4 8 8 8 8
158 171 181 298 332 281 307
5 39.50 42.75 45.25 37.25 41.50 35.125 38.375
MS 112.4821 56.54167 2.136905
33 9.0000 4.9167 11.5833
25.0714 30.5714 33.5536 29.6964
P-value 6.7E-12 2.5E-07
F crit 2.4876 3.0725
SS 787.375 169.625 44.875 1001.875
df 7 3 21 31
F 52.6379 26.4596
8.2.2可重复的双因素方差分析
如果要考察两个因素之间是否存在交互影响,则需要对两个因素各种水平的组合进行重复试验。
案例:某汽车调查公司试图了解三种品牌汽车在不同车速下的油耗。经四次重复实验,得到以下一组数据(表8.5)。
试在显著性水平α为0.05条件下检验: (1)三种品牌之间的油耗是否存在差异? (2)汽车对耗油量是否有影响?
(3)汽车品牌与行驶速度之间是否存在交互影响? 操作步骤如前:
选择工具栏
选择数据分析
选择双因素分析
确定数据输入区 域、显示区域和α
选择确定即可 获得建议结果
进行双因素方差分析时必须注意,在选取数据区域时应该包含标志栏(表
8.6中的列A和行2数据),因此数据区域应为A2:18,否则分析结果不正确。
表8.6 数据输入及输出区域的确定
选择可重复双因素方差分析对话框中的确定键,就可获得统计分析结果。
我们仅列出简化表8.7:
方差分析
总计
446.2
6
47
通过F统计量与对应临界值的比较分析可以得到以下结果:汽车品牌和行驶速度对油耗均有显著影响,而两者之间则并无交互影响。
第九章 相关回归分析(Regression and Correlation) 相关分析(correlation analysis)是研究变量之间关联强度或一致程度的统计分析方法,可分为单相关和复相关两种基本分析方法。相关系数是测定相关强度的重要指标。
回归分析方法则是通过经济现象的相关分析,建立被解释变量(因变量)和解释变量(自变量)之间的统计模型,以研究各变量之间彼此作用和影响的关系。研究“一因一果”,即一个自变量(解释变量)与一个应变量(被解释变量)的回归分析称为一元回归分析;研究“多因一果”,即多个自变量与一个应变量的回归分析称为多元回归分析。此外,回归分析中,又依据描述自变量与应变量之间因果关系的函数表达式分为线性回归分析和非线性回归分析。线性回归分析是
最基本的分析方法,遇到非线性问题通常可以借助数学手段化为线性回归问题处理。回归分析必须满足变量的独立性、分布的正态性、方差齐次性和无自相关性等条件。
9.1 一元线性回归分析
一元线性回归分析是用于描述两变量之间平均关系的线性方程。如果观察值数据在散点图中大致分布于一条直线上下,则可以考虑拟合一元线性回归模型。
案例:某市房产公司通过市场调查,获得以下一组关于住宅居住面积(平方英尺,SqFt)与销售价格(千美元,Price)的数据。
图9.1 居住面积与销售价格散点图
通过分析发现,房价高低基本依赖于住宅居住面积,所以售价为依赖变量而平方英尺面积为解释变量。为了检验两者的依存程度,可以进行回归分析。基本步骤为:
(1) 打开工具栏,选择“数据分析”中的“回归”分析方法,分别输入相应数据(显著性水平为0.05),即可出现如图9.2所示的对话框;
图9.2 回归模型选项对话框
(2) 选择对话框中的“确定”键,可以获得表9.1和表9.2所示的输出结果;
表9.1 回归结果输出表
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R
2
0.8147(相关系数) 0.6637(测定系数) 0.6378(修正测定系数)
标准误差 观测值 方差分析
3.2378(估计标准误差) 15
Significance
df
SS 268.90
回归分析 残差 总计
1 13 14
26 136.28405.18
4 标准误
Coefficients
18.7
Intercept X Variable 1
895 0.02101
差 3.8686
59 0.0041
t Stat 4.857 5.06
P-value 0.00031 0.00022
0.0120482 10.431739 Lower 95%
Upper 95% 27.147196 0.0299723
下限 95.0% 10.431739 0.0120482
上限 95.0% 27.14719557 0.029972314
MS 268.9 10.4
F 25.651
0.0002168
F
14 83
484 47
表9.2 残差分析表
(3) 结果解释:
根据表9.1和表9.2中各种数值,可得到趋势模型为:
Price18.78950.02101SqFt
拟合度评价:相关系数r=0.8147,表明价格与面积呈高度相关关系; 测定系数r2=0.6637,说明售价中的66.37%的变化可以用居住面积通过线性模型来解释;估计标准误差Se=3.2378,用以说明回归方程代表性的好坏。
统计检验:统计量tb=5.0647>t0.05/2(13)=2.160,表示回归系数与零存在显著差异;统计量F=25.651>Fα(1,13)=4.67 ,说明回归模型有效。
9.2 多元线性回归分析
上小节用简单线性回归模型研究了15个样本的住宅面积与售价的关系,标准误差为3238,测定系数是66.37%,售价的变化66%左右可以通过居住面积得以解释;而售价更多的变化必须用更多的变量来解释。
多元回归是表达一个因变量与两个或两个以上的自变量之间的线性依存关系的回归模型。上例中如果在面积的基础上再考虑为财产税收目而进行的事先评估因素,还可以改善拟合效果。研究售价与面积和评估两个解释变量并据此建立回归模型,这种分析即为多元回归分析。
(1) 数据建立:类似于一元线性回归模型,合理安排解释和被解释变量,从工具栏中选择“数据分析”并确定,在输入和输出区域分别选择数据,设显著性水平为0.05,容易得到图9.3 。
图9.3 多元回归对话框
(2) 结果输出
(3) 统计解释
9.3 非线性回归分析