摘要 DSS的应用可分为二类:例行分析处理和启发式分析处理。前者是指那些重复进行的分析处理,它通常是属于部门级的应用,如部门统计分析,报表分析等等。后者指在个人级的分析应用中由于随机性很大,决策者受到某种信息启发而进行的一些兴席的分析处理。 关键词 SAS系统 应用管理 基本组成 功能 中图分类号:G642 文献标识码:A 管理数据仓库的日常活动。数据仓库的开发是逐步完善的开发方法,它要求能尽快地让系统运行起来,尽早产生收益;要在系统运行或使用中,不断地理解需求,调整和完善系统。管理数据仓库的工作主要是管理日常数据装入的工作,包括刷新数据仓库的当前详细数据、将过时的数据转化成历史数据、清除不再使用的数据、调整粒度级别,管理元数据等;另外还有,如何利用接口定期从操作型环境向数据仓库追加数据,确定数据仓库的数据刷新频率等。 一、SAS数据仓库 早期的计算机主要是用来进行数据处理或称数据计算的,随着计算机技术及其外围设备和通信能力的提高,计算机更多地用于大量繁杂事务的在线处理、千百万设备的实时控制等。在此过程中,计算机系统积累了越来越多的数据,数据处理的任务更加繁重。在当今,企业面对堆积如山的数据应如何正确处理以支持经营者做出正确的决策,是关系到企业成败的大事。美国SAS软件从20世纪60年代在北卡州立大学就致力于计算机数据处理的研究,几十年来,无数的成功事例使人们推崇SAS为国际上标准的数据统计软件。SAS具有丰富的数据采集、数据管理、数据分析和信息展现等功能,使之成为决策支持系统的最好工具,下文简单介绍SAS软件的基本组成和功能。 二、SAS系统的基本组成 SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)、SAS/ACCESS(数据抽取)、SAS/WA(数据仓库管理)、SAS/EIS(菜单驱动的行政信息系统开发工具)、SAS/INSIGHT(交互式数据探索与可视化工具)、SAS/Enterprise Miner(数据挖掘产品)等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。 三、SAS数据仓库的功能 数据仓库是适应决策支持系统的需要而产生的,所以人们希望所采用的软件产品能支持决策过程的全部工作内容,SAS的数据仓库技术就可以支持决策全过程。下面以SAS数据仓库为例说明数据仓库的功能。 (一)SAS系统的数据存取功能力。 SAS有一个SAS/ACCESS(数据抽取)产品,利用它对众多不同格式的数据进行查询、访问和分析。SAS/ACCESS提供了与目前许多流行数据库软件和老的数据文件的接口,用SASS/ACCESS可建立对应外部异构数据的一个统一的共用数据界面。所提供的与外部数据的接口是透明和动态的。用户有时不必将数据真的读到SAS系统中来,而只需在SAS系统中建立对外部数据的描述(也即所谓VIEW),便可把这些外部数据当做真正存储在SAS系统中的数据集一样使用。这时,用户即可使用这些数据进行所谓ROLAP式的数据分析和决策工作。对一些经常使用的外部数据,也可利用SAS/ACCESS将其真正提取放入SAS系统中,并进一步经过整理放进数据库。SAS/ACCESS提供的接口是双向的,既可将数据读入SAS系统,也可在SAS系统中更新外部数据,或将数据加载到外部数据载体中去,这使数据仓库系统和原有的运行数据体系更加沟通。 (二)数据的清理和整合。 在SAS的数据仓库中有专门的机制进行引入数据的检查、核对和将不同来源数据进行整合的技术环节。在一个企业或其他大型的组织中,各种数据可能有不同的类型,格式可能也不尽统一。 从业务操作系统中引入的数据必须进行其完整性的检查。在一条记录中,各个数据项之间应有一定的存在关系。若有缺陷,且又没有检查,必然会给将来的统计、决策造成偏差。 数据的有效性也是必须进行校对的,以防止将数据源中的错误带入决策过程中,这些必要的清理工作保障了决策所使用数据的质量。此外,还可以加入用户自己认为需要加强环节,系统允许在数据整理的各个层次加上用户强化环节。 (三)数据仓库的加载和更新。 从数据源抽取数据不仅有质量问题,还有计划地按一定时间节奏从数据源取出和装入、更新数据仓库的问题。因为SAS系统不主动去取外部数据的能力,所以按时间节奏从数据源取出数据的操作在和其他系统管理人员协调好的基础上,就可完全在SAS系统内制定从各系统取用数据的计划。在此基础上,数据仓库按照数据和信息使用的时间要求,准时加载、更新就完全有保障了。 从数据源到数据仓库一气呵成的集成式的操作,这是SAS数据仓库技术的重要特点。 (四)按决策需要重组数据和信息。 清理好的数据还要重组。按照决策的需要组织成不同主题的数据仓库表,这是十分关键性的操作。在任何一个企业或组织中,总是有许多业务和技术环节的,一般来说,数据库的设计也总是针对这些业务和技术环节设置“实体”,即数据库的表,这样的设计使OLTP系统发挥了最大的工作效率。但在开发决策支持的OLAP时,这种结构的数据,特别是对于全企业范围的数据进行操作时,其效率极低,这是因为可能要从许多表中取出所需数据,而且可能还要进行数据的筛选、拟合,这是极费时间和资源的。企业范围的决策是对各个环节的业务种类重组,这就需要有相应数据结构的重组,即按决策的需要组织成不同主题的数据仓库表以及相应的数据视图、汇总表等,SAS为此设置了交互式操作的界面。 (五)丰富的决策数据处理能力。 SAS在这方面具有世界领先的丰富的决策数据处理软件。SAS/STAT覆盖了所有的实用数理统计分析方法,是国际统计分析领域的标准软件,它提供了十多个程序,可进行各种不同模型或不同特点的回归分析;为多种试验设计模型提供了方差分析工具;在多变量统计分析方面,为主成份分析、相关分析、判别分析和因子分析提供了许多专用程序;还包括多种聚类准则的聚类分析方法等。 SAS/ETS提供了丰富的计量经济学和时序列分析方法,是研究复杂系统和进行预测的有力工具。SAS/OR提供了全面的运筹学方法。SAS/IML提供了功能强大的面向矩阵运算的编程语言,帮助研究新算法,或解决SAS系统中没有现成算法的专门问题。SAS/INSIGHT是一个可视化的数据探索工具,它将统计方法与交互式图形显示融合在一起,为你展现了一种全新的使用统计分析方法的环境。还有SAS的人工神经元网络和SAS/ASSIST等许多适合各个层次、各种类型人员使用的工具。 (六)灵活多样的结果展现方式。 分析结果的展现方式对决策时人的判断有重要的影响,SAS也有众多的方式、方法供你选择: 1、 Base SAS中就有从简单列表到比较复杂的统计报表和用户自定义的式样所产生的复杂的报表能力。 2、SAS/ER(Enterprise Report)为企业级的决策过程提供了报告的制作能力。 3、SAS/GRAPH是一个强有力的图形软件包,可将数据及其包含的深层信息以多种图形生动地呈现出来。 从种数据源主动地取出数据,经过清理、整合,再按决策的需要分别主题重组数据,按照时序节奏不断地自动装载、更新数据仓库,用世界权威的、丰富的数据处理工具进行决策分析,最后以多种形式将决策的意见呈现给用户,这就是完整的决策支持数据仓库解决方案。 通过SAS对异构数据库的支持和优秀的跨平台处理能力,可对现有的数据库进行数据提取和整合,并按照主题存储在数据仓库中。在数据仓库的基础之上,可利用SAS的分析功能和强大的结果展现工具,进行分析、预警,及进行预测,从而很好的满足用户的需求。但由于SAS系统是从大型机上的系统发展而来,其操作至今仍以编程为主,人机对话界面不太友好,并且在编程操作时需要用户最好对所使用的统计方法有较清楚的了解,非统计专业人员掌握起来较困难。□ (作者单位:海军装备研究院) 参考文献: [1]徐夕水;刘丽均,统计分析系统SAS软件的应用,中国饲料,1998/09,8/550 [2]王泽军;韩在峰,基于整合模式的EMS/SAS监控系统研究与设计,电子技术应用,2010/09,/25 [3]吴本中,统计分析系统SAS介绍,计算机应用与软件,1987/04,3/60
摘要 DSS的应用可分为二类:例行分析处理和启发式分析处理。前者是指那些重复进行的分析处理,它通常是属于部门级的应用,如部门统计分析,报表分析等等。后者指在个人级的分析应用中由于随机性很大,决策者受到某种信息启发而进行的一些兴席的分析处理。 关键词 SAS系统 应用管理 基本组成 功能 中图分类号:G642 文献标识码:A 管理数据仓库的日常活动。数据仓库的开发是逐步完善的开发方法,它要求能尽快地让系统运行起来,尽早产生收益;要在系统运行或使用中,不断地理解需求,调整和完善系统。管理数据仓库的工作主要是管理日常数据装入的工作,包括刷新数据仓库的当前详细数据、将过时的数据转化成历史数据、清除不再使用的数据、调整粒度级别,管理元数据等;另外还有,如何利用接口定期从操作型环境向数据仓库追加数据,确定数据仓库的数据刷新频率等。 一、SAS数据仓库 早期的计算机主要是用来进行数据处理或称数据计算的,随着计算机技术及其外围设备和通信能力的提高,计算机更多地用于大量繁杂事务的在线处理、千百万设备的实时控制等。在此过程中,计算机系统积累了越来越多的数据,数据处理的任务更加繁重。在当今,企业面对堆积如山的数据应如何正确处理以支持经营者做出正确的决策,是关系到企业成败的大事。美国SAS软件从20世纪60年代在北卡州立大学就致力于计算机数据处理的研究,几十年来,无数的成功事例使人们推崇SAS为国际上标准的数据统计软件。SAS具有丰富的数据采集、数据管理、数据分析和信息展现等功能,使之成为决策支持系统的最好工具,下文简单介绍SAS软件的基本组成和功能。 二、SAS系统的基本组成 SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)、SAS/ACCESS(数据抽取)、SAS/WA(数据仓库管理)、SAS/EIS(菜单驱动的行政信息系统开发工具)、SAS/INSIGHT(交互式数据探索与可视化工具)、SAS/Enterprise Miner(数据挖掘产品)等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。 三、SAS数据仓库的功能 数据仓库是适应决策支持系统的需要而产生的,所以人们希望所采用的软件产品能支持决策过程的全部工作内容,SAS的数据仓库技术就可以支持决策全过程。下面以SAS数据仓库为例说明数据仓库的功能。 (一)SAS系统的数据存取功能力。 SAS有一个SAS/ACCESS(数据抽取)产品,利用它对众多不同格式的数据进行查询、访问和分析。SAS/ACCESS提供了与目前许多流行数据库软件和老的数据文件的接口,用SASS/ACCESS可建立对应外部异构数据的一个统一的共用数据界面。所提供的与外部数据的接口是透明和动态的。用户有时不必将数据真的读到SAS系统中来,而只需在SAS系统中建立对外部数据的描述(也即所谓VIEW),便可把这些外部数据当做真正存储在SAS系统中的数据集一样使用。这时,用户即可使用这些数据进行所谓ROLAP式的数据分析和决策工作。对一些经常使用的外部数据,也可利用SAS/ACCESS将其真正提取放入SAS系统中,并进一步经过整理放进数据库。SAS/ACCESS提供的接口是双向的,既可将数据读入SAS系统,也可在SAS系统中更新外部数据,或将数据加载到外部数据载体中去,这使数据仓库系统和原有的运行数据体系更加沟通。 (二)数据的清理和整合。 在SAS的数据仓库中有专门的机制进行引入数据的检查、核对和将不同来源数据进行整合的技术环节。在一个企业或其他大型的组织中,各种数据可能有不同的类型,格式可能也不尽统一。 从业务操作系统中引入的数据必须进行其完整性的检查。在一条记录中,各个数据项之间应有一定的存在关系。若有缺陷,且又没有检查,必然会给将来的统计、决策造成偏差。 数据的有效性也是必须进行校对的,以防止将数据源中的错误带入决策过程中,这些必要的清理工作保障了决策所使用数据的质量。此外,还可以加入用户自己认为需要加强环节,系统允许在数据整理的各个层次加上用户强化环节。 (三)数据仓库的加载和更新。 从数据源抽取数据不仅有质量问题,还有计划地按一定时间节奏从数据源取出和装入、更新数据仓库的问题。因为SAS系统不主动去取外部数据的能力,所以按时间节奏从数据源取出数据的操作在和其他系统管理人员协调好的基础上,就可完全在SAS系统内制定从各系统取用数据的计划。在此基础上,数据仓库按照数据和信息使用的时间要求,准时加载、更新就完全有保障了。 从数据源到数据仓库一气呵成的集成式的操作,这是SAS数据仓库技术的重要特点。 (四)按决策需要重组数据和信息。 清理好的数据还要重组。按照决策的需要组织成不同主题的数据仓库表,这是十分关键性的操作。在任何一个企业或组织中,总是有许多业务和技术环节的,一般来说,数据库的设计也总是针对这些业务和技术环节设置“实体”,即数据库的表,这样的设计使OLTP系统发挥了最大的工作效率。但在开发决策支持的OLAP时,这种结构的数据,特别是对于全企业范围的数据进行操作时,其效率极低,这是因为可能要从许多表中取出所需数据,而且可能还要进行数据的筛选、拟合,这是极费时间和资源的。企业范围的决策是对各个环节的业务种类重组,这就需要有相应数据结构的重组,即按决策的需要组织成不同主题的数据仓库表以及相应的数据视图、汇总表等,SAS为此设置了交互式操作的界面。 (五)丰富的决策数据处理能力。 SAS在这方面具有世界领先的丰富的决策数据处理软件。SAS/STAT覆盖了所有的实用数理统计分析方法,是国际统计分析领域的标准软件,它提供了十多个程序,可进行各种不同模型或不同特点的回归分析;为多种试验设计模型提供了方差分析工具;在多变量统计分析方面,为主成份分析、相关分析、判别分析和因子分析提供了许多专用程序;还包括多种聚类准则的聚类分析方法等。 SAS/ETS提供了丰富的计量经济学和时序列分析方法,是研究复杂系统和进行预测的有力工具。SAS/OR提供了全面的运筹学方法。SAS/IML提供了功能强大的面向矩阵运算的编程语言,帮助研究新算法,或解决SAS系统中没有现成算法的专门问题。SAS/INSIGHT是一个可视化的数据探索工具,它将统计方法与交互式图形显示融合在一起,为你展现了一种全新的使用统计分析方法的环境。还有SAS的人工神经元网络和SAS/ASSIST等许多适合各个层次、各种类型人员使用的工具。 (六)灵活多样的结果展现方式。 分析结果的展现方式对决策时人的判断有重要的影响,SAS也有众多的方式、方法供你选择: 1、 Base SAS中就有从简单列表到比较复杂的统计报表和用户自定义的式样所产生的复杂的报表能力。 2、SAS/ER(Enterprise Report)为企业级的决策过程提供了报告的制作能力。 3、SAS/GRAPH是一个强有力的图形软件包,可将数据及其包含的深层信息以多种图形生动地呈现出来。 从种数据源主动地取出数据,经过清理、整合,再按决策的需要分别主题重组数据,按照时序节奏不断地自动装载、更新数据仓库,用世界权威的、丰富的数据处理工具进行决策分析,最后以多种形式将决策的意见呈现给用户,这就是完整的决策支持数据仓库解决方案。 通过SAS对异构数据库的支持和优秀的跨平台处理能力,可对现有的数据库进行数据提取和整合,并按照主题存储在数据仓库中。在数据仓库的基础之上,可利用SAS的分析功能和强大的结果展现工具,进行分析、预警,及进行预测,从而很好的满足用户的需求。但由于SAS系统是从大型机上的系统发展而来,其操作至今仍以编程为主,人机对话界面不太友好,并且在编程操作时需要用户最好对所使用的统计方法有较清楚的了解,非统计专业人员掌握起来较困难。□ (作者单位:海军装备研究院) 参考文献: [1]徐夕水;刘丽均,统计分析系统SAS软件的应用,中国饲料,1998/09,8/550 [2]王泽军;韩在峰,基于整合模式的EMS/SAS监控系统研究与设计,电子技术应用,2010/09,/25 [3]吴本中,统计分析系统SAS介绍,计算机应用与软件,1987/04,3/60