分类算法的特征变量选取方法研究

分类算法的特征变量选取方法研究

摘要

特征选取是模式识别中的关键技术之一。模式识别的最终目的是实现对观察对象的分类,而分类的基础是模式类的数学表达。在模式识别理论中,模式类是通过特征来表示的,特征选择的好坏直接影响分类器的性能。在模式识别系统设计中,特征的确定往往是一个反复的过程,是其中的难点和关键。特征选择往往有赖于对识别问题的了解,对领域知识有较强的依赖性。特征选择和提取的任务是如何从许多特征中找出那些最有效的特征,把高维特征空间压缩到低维特征空间。

本文首先介绍了特征选取的研究背景,发展过程和关键步骤。接着,本文又粗略介绍了特征选取的一些方法。之后本文详细介绍了T 测试和Fisher 判据进行特征选取的原理和方法,并设计和实现了相关的算法。最后本文也对两种方法进行了对比。

关键词:特征选取;T 测试;Fisher 判据;

ABSTRACT

Feature extraction is the elementary problem in the area of pattern recognition .Pattern recognition's aim is to realize the classification of observable object. And classification of is the basis of the mathematical expression mode. In pattern recognition theory, the model is expressed by features. Feature selection will have a direct impact on the performance of classifier. In pattern recognition system design, the characteristics of the sure is often a repeated process, they are the difficulties and key. Feature selection often depends on the knowledge and understanding of the recognition problem, depending on domain knowledge. Feature selection and extraction from the task is to find out how many features that the most effective features, the feature space compression to low high dimensional space dimension characteristic.

Firstly, this paper discussed the background, the development and the key step of the feature extraction briefly, and then, the paper also sketched out a number of

feature extraction methods. Besides giving a minute description of the principles and methods of T-test and Fisher ’s discriminant ratio. We designed and implemented the algorithms In the experiment. Finally, we also compared the two methods.

Key Words: Feature selection;T-test; Fisher’s discriminant ratio;

第一章 引言............................................................................................ 错误!未定义书签。

1.1 课题背景......................................................................................... 错误!未定义书签。

1.2 国内外研究现状及发展.................................................................. 错误!未定义书签。

1.3 本课题研究主要内容.................................................................... 错误!未定义书签。

1.4 本文主要章节安排.......................................................................... 错误!未定义书签。

第二章 T 测试法特征选取........................................................................... 错误!未定义书签。

2.1引言.................................................................................................. 错误!未定义书签。

2.2 孤立点的去除方法.......................................................................... 错误!未定义书签。

2.3 T测试法特征选取方法的研究....................................................... 错误!未定义书签。

2.4 基于假设检验的T 测试法特征选取一般步骤............................. 错误!未定义书签。

2.4.1 实验说明............................................................................... 错误!未定义书签。

2.4.2 实验数据............................................................................... 错误!未定义书签。

2.4.3 实验思路............................................................................... 错误!未定义书签。

2.4.4 实验程序流程图................................................................... 错误!未定义书签。

第三章 Fisher 线性判别法特征选取........................................................... 错误!未定义书签。

3.1引言.................................................................................................. 错误!未定义书签。

3.2 Fisher 线性判别法的基本理论....................................................... 错误!未定义书签。

3.3 Fisher线性判据特征选取方法........................................................ 错误!未定义书签。

3.4实验.................................................................................................. 错误!未定义书签。

3.4.1实验说明................................................................................ 错误!未定义书签。

3.4.2 实验数据............................................................................... 错误!未定义书签。

3.4.3 本实验的设计思路............................................................... 错误!未定义书签。

3.4.4 程序流程图........................................................................... 错误!未定义书签。

3.4.5 实验结果............................................................................... 错误!未定义书签。

3.4.6 小结...................................................................................... 错误!未定义书签。

第四章 T 测试法与Fisher 判据法的特征选取结果对比与分析............... 错误!未定义书签。

4.1 T测试法特征选取特点................................................................... 错误!未定义书签。

4.2 Fisher判据法的特征选取特点........................................................ 错误!未定义书签。 参考文献........................................................................................................ 错误!未定义书签。 致 谢........................................................................................................ 错误!未定义书签。

………………………………………………………………………………………………………………………………………………………………

本论文为本人朋友的大学本科毕业设计最终版,通过了指导老师和评阅老师的审核。格式正确,论文详实!上传了部分的初衷是防止出现雷同,完整版本请联系本人:1456427153,若本人不在线,请留言!

分类算法的特征变量选取方法研究

摘要

特征选取是模式识别中的关键技术之一。模式识别的最终目的是实现对观察对象的分类,而分类的基础是模式类的数学表达。在模式识别理论中,模式类是通过特征来表示的,特征选择的好坏直接影响分类器的性能。在模式识别系统设计中,特征的确定往往是一个反复的过程,是其中的难点和关键。特征选择往往有赖于对识别问题的了解,对领域知识有较强的依赖性。特征选择和提取的任务是如何从许多特征中找出那些最有效的特征,把高维特征空间压缩到低维特征空间。

本文首先介绍了特征选取的研究背景,发展过程和关键步骤。接着,本文又粗略介绍了特征选取的一些方法。之后本文详细介绍了T 测试和Fisher 判据进行特征选取的原理和方法,并设计和实现了相关的算法。最后本文也对两种方法进行了对比。

关键词:特征选取;T 测试;Fisher 判据;

ABSTRACT

Feature extraction is the elementary problem in the area of pattern recognition .Pattern recognition's aim is to realize the classification of observable object. And classification of is the basis of the mathematical expression mode. In pattern recognition theory, the model is expressed by features. Feature selection will have a direct impact on the performance of classifier. In pattern recognition system design, the characteristics of the sure is often a repeated process, they are the difficulties and key. Feature selection often depends on the knowledge and understanding of the recognition problem, depending on domain knowledge. Feature selection and extraction from the task is to find out how many features that the most effective features, the feature space compression to low high dimensional space dimension characteristic.

Firstly, this paper discussed the background, the development and the key step of the feature extraction briefly, and then, the paper also sketched out a number of

feature extraction methods. Besides giving a minute description of the principles and methods of T-test and Fisher ’s discriminant ratio. We designed and implemented the algorithms In the experiment. Finally, we also compared the two methods.

Key Words: Feature selection;T-test; Fisher’s discriminant ratio;

第一章 引言............................................................................................ 错误!未定义书签。

1.1 课题背景......................................................................................... 错误!未定义书签。

1.2 国内外研究现状及发展.................................................................. 错误!未定义书签。

1.3 本课题研究主要内容.................................................................... 错误!未定义书签。

1.4 本文主要章节安排.......................................................................... 错误!未定义书签。

第二章 T 测试法特征选取........................................................................... 错误!未定义书签。

2.1引言.................................................................................................. 错误!未定义书签。

2.2 孤立点的去除方法.......................................................................... 错误!未定义书签。

2.3 T测试法特征选取方法的研究....................................................... 错误!未定义书签。

2.4 基于假设检验的T 测试法特征选取一般步骤............................. 错误!未定义书签。

2.4.1 实验说明............................................................................... 错误!未定义书签。

2.4.2 实验数据............................................................................... 错误!未定义书签。

2.4.3 实验思路............................................................................... 错误!未定义书签。

2.4.4 实验程序流程图................................................................... 错误!未定义书签。

第三章 Fisher 线性判别法特征选取........................................................... 错误!未定义书签。

3.1引言.................................................................................................. 错误!未定义书签。

3.2 Fisher 线性判别法的基本理论....................................................... 错误!未定义书签。

3.3 Fisher线性判据特征选取方法........................................................ 错误!未定义书签。

3.4实验.................................................................................................. 错误!未定义书签。

3.4.1实验说明................................................................................ 错误!未定义书签。

3.4.2 实验数据............................................................................... 错误!未定义书签。

3.4.3 本实验的设计思路............................................................... 错误!未定义书签。

3.4.4 程序流程图........................................................................... 错误!未定义书签。

3.4.5 实验结果............................................................................... 错误!未定义书签。

3.4.6 小结...................................................................................... 错误!未定义书签。

第四章 T 测试法与Fisher 判据法的特征选取结果对比与分析............... 错误!未定义书签。

4.1 T测试法特征选取特点................................................................... 错误!未定义书签。

4.2 Fisher判据法的特征选取特点........................................................ 错误!未定义书签。 参考文献........................................................................................................ 错误!未定义书签。 致 谢........................................................................................................ 错误!未定义书签。

………………………………………………………………………………………………………………………………………………………………

本论文为本人朋友的大学本科毕业设计最终版,通过了指导老师和评阅老师的审核。格式正确,论文详实!上传了部分的初衷是防止出现雷同,完整版本请联系本人:1456427153,若本人不在线,请留言!


相关文章

  • 数据挖掘十大经典算法
  • 数据挖掘十大经典算法 一. C4.5 C4.5算法是机器学习算法中的一种分类决策树算法, 其核心算法是ID3 算 法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增 ...查看


  • 几种多元统计分析方法及其在生活中的应用[1]
  • 第2章聚类分析及其应用实例 2. 1聚类分析简介 聚类分析是根据"物以类聚"的道理,对样品或指标进行分类的一种多元统 计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性來进行 合理的分类,没有任何模式可供参 ...查看


  • 基于PCA的人脸识别研究报告
  • 项目名称:基于PCA 的人脸识别算法研究 摘 要 随着人类社会的进步,以及科技水平的提高,一些传统的身份认证的方法逐渐暴 露出各种问题,因此人们需要采用一种更加可靠安全的身份认证方法.毫无疑问人体 的生物特征的独一无二的,特别是其不容易丢失 ...查看


  • 机器人视觉中物体识别实验系统设计
  • 机器人视觉中物体识别实验系统设计 摘 要 作为机电一体化产品的典型代表,机器人在逐渐走向智能化.而通过 视觉来对周围环境中的物体进行识别的技术是机器人智能化的重要标志.具有"视觉"且能够识别物体的机器人可以获取外部世界图 ...查看


  • 机器人室内定位技术说明书
  • 新型机器人室内定位技术 XXX软件研究所有限公司 一,技术背景 机器人六十年代,自第一台机器人装置诞生以来,机器人的发展经历了一个从低级到高级的发展过程.第一代机器人为示教再现型机器人,是通过计算机来控制多自主的机械装置,通过示教存储程序把 ...查看


  • 45农用地定级决策树模型构建与应用研究pdf
  • ComputerEngineeringandApplications计算机工程与应用2009,45(29)241 农用地定级决策树模型构建与应用研究 赵璐1,郑新奇1,闫弘文2,郭正鑫3ZHAOLu1,ZHENGXin-qi1,YANHon ...查看


  • 大规模交通流预测方法研究
  • 第13卷第3期 2013年6月 JoumaIof 交通运输系统工程与信息 TransponationSystemsEn西neeringandI山mationTechnology m5 V01.13 June No.32013 文章编号:10 ...查看


  • 基于Logistic回归模型的机械状态健康评估研究_李锋锋
  • 维修与管理 文章编号:1671-0711(2009)05-0020-03 基于Logistic 回归模型的 机械状态健康评估研究 李锋锋 (北京化工大学诊断与自愈工程研究中心,北京100029) 摘 要:在设备运行过程中,旋转机械的状态会由 ...查看


  • 基于稀疏编码的自然图像特征提取及去噪
  • • 1782 • 系 统 仿 真 学 报 V ol. 17 No. 7 JOURNAL OF SYSTEM SIMULATION July 2005 基于稀疏编码的自然图像特征提取及去噪 尚 丽1,2,郑春厚1,2 (1 中国科学院合肥分院 ...查看


热门内容