最大最小距离算法以及实例

最大最小距离算法实例

10个模式样本点{x1(0 0), x2(3 8), x3(2 2), x4(1 1), x 5(5 3), x6(4 8), x7(6 3), x8(5 4), x9(6 4), x10(7 5)}

第一步:选任意一个模式样本作为第一个聚类中

心,如z 1 = x1;

第二步:选距离z 1最远的样本作为第二个聚类中心。

经计算,|| x6 - z1 ||最大,所以z 2 = x6;

第三步:逐个计算各模式样本{xi , i = 1,2,…,N}与{z1,

z 2}之间的距离,即

D i1 = || xi - z1 ||

D i2 = || xi – z2 ||

并选出其中的最小距离min(Di1, D i2) ,i = 1,2, …,N

第四步:在所有模式样本的最小值中选出最大距

离,若该最大值达到||z1 - z 2 ||的一定比例以上,则相应的样本点取为第三个聚类中心z 3,即:若max{min(Di1, Di2), i = 1,2,…,N} >θ||z1 - z2 ||,则z 3 = xi

否则,若找不到适合要求的样本作为新的聚类中心,则找聚类中心的过程结束。 这里,θ可用试探法取一固定分数,如1/2。 在此例中,当i=7时,符合上述条件,故z 3 = x7

第五步: 若有z 3存在,则计算max{min(Di1, Di2, Di3),

i = 1,2,…,N}。若该值超过||z1 - z2 ||的一定比例,则存在z 4,否则找聚类中心的过程结束。

在此例中,无z 4满足条件。

第六步:将模式样本{x i , i = 1,2,…,N }按最近距离分

到最近的聚类中心:

z 1 = x1:{x1, x3, x4}为第一类

z 2 = x6:{x2, x6}为第二类

z 3 = x7:{x5, x7, x8, x9, x10}为第三类 最后,还可在每一类中计算各样本的均值,得到更具代表性的聚类中心。

最大最小距离算法实例

10个模式样本点{x1(0 0), x2(3 8), x3(2 2), x4(1 1), x 5(5 3), x6(4 8), x7(6 3), x8(5 4), x9(6 4), x10(7 5)}

第一步:选任意一个模式样本作为第一个聚类中

心,如z 1 = x1;

第二步:选距离z 1最远的样本作为第二个聚类中心。

经计算,|| x6 - z1 ||最大,所以z 2 = x6;

第三步:逐个计算各模式样本{xi , i = 1,2,…,N}与{z1,

z 2}之间的距离,即

D i1 = || xi - z1 ||

D i2 = || xi – z2 ||

并选出其中的最小距离min(Di1, D i2) ,i = 1,2, …,N

第四步:在所有模式样本的最小值中选出最大距

离,若该最大值达到||z1 - z 2 ||的一定比例以上,则相应的样本点取为第三个聚类中心z 3,即:若max{min(Di1, Di2), i = 1,2,…,N} >θ||z1 - z2 ||,则z 3 = xi

否则,若找不到适合要求的样本作为新的聚类中心,则找聚类中心的过程结束。 这里,θ可用试探法取一固定分数,如1/2。 在此例中,当i=7时,符合上述条件,故z 3 = x7

第五步: 若有z 3存在,则计算max{min(Di1, Di2, Di3),

i = 1,2,…,N}。若该值超过||z1 - z2 ||的一定比例,则存在z 4,否则找聚类中心的过程结束。

在此例中,无z 4满足条件。

第六步:将模式样本{x i , i = 1,2,…,N }按最近距离分

到最近的聚类中心:

z 1 = x1:{x1, x3, x4}为第一类

z 2 = x6:{x2, x6}为第二类

z 3 = x7:{x5, x7, x8, x9, x10}为第三类 最后,还可在每一类中计算各样本的均值,得到更具代表性的聚类中心。


相关文章

  • 空间聚类算法中的K值优化问题研究
  • 第18卷第3期 系 统 仿 真 学 报 Vol. 18 No. 3 2006年3月 Journal of System Simulation Mar., 2006 空间聚类算法中的K值优化问题研究 李永森,杨善林,马溪骏,胡笑旋,陈增明 ( ...查看


  • 几种多元统计分析方法及其在生活中的应用[1]
  • 第2章聚类分析及其应用实例 2. 1聚类分析简介 聚类分析是根据"物以类聚"的道理,对样品或指标进行分类的一种多元统 计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性來进行 合理的分类,没有任何模式可供参 ...查看


  • 2011甘肃省高考语文试卷
  • 1.已知一个比例中两个外项的积是最小的合数,一个内项是5/6,另一个内项是( ). 2.判断. 1.小数都比整数小.( ) 2.把一根长为1米的绳子分成5段,每段长1/5米.( ) 3.甲数的1/4等于乙数的1/6,则甲乙两数之比为2:3. ...查看


  • 持续碰撞检测预防误差
  • 持续碰撞检测预防误差 摘要: 在持续碰撞检测中由于人为的原因会引入一些数值误差和舍入误差.利用误差公差可以解决这些误差,但是对于用户来说找到最优误差比较困难.大的误差会引起错报现象,小的误差不易被检测出来.我们面临的最大问题就是不知道什么时 ...查看


  • 2010河北省高考英语试题
  • 1.(4分)(2014?上海)据统计,2013年上海市全社会用于环境保护的资金约为60 800 000 000元,这个数用科学记数法表示为( ) A. 608×108 B. 60.8×109 C. 6.08×1010 D. 6.08×101 ...查看


  • 基于重心法的医院选址的应用终稿3
  • 目 录 摘 要................................................................................................................. ...查看


  • 算法杂货铺
  • 算法杂货铺 算法杂货铺............................................................................................................. ...查看


  • 分类算法总结
  • 分类算法 数据挖掘中有很多领域,分类就是其中之一,什么是分类, 分类就是把一些新得数据项映射到给定类别的中的某一个类别,比如说当我们发表一篇文章的时候,就可以自动的把这篇文章划分到某一个文章类别,一般的过程是根据样本数据利用一定的分类算法得 ...查看


  • 露天矿生产运输车辆安排
  • 露天矿生产车辆运输安排 摘 要 对于本文所涉及的问题,首先根据题意,分析出其不同于常见的运输问题,按照原题对两个原则的划分,分别建立模型,再在此基础上,将每个原则分为两步解决: 第一步:找到最佳物流结果: 第二步:对各条线路车辆进行合理安排 ...查看


热门内容