论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 聚类分析论文 a类期刊有哪些 机械类杂志 医药类期刊 国家级教育类期刊 交通类期刊 matlab聚类分析参考文献 聚类算法开题报告 聚类分析参考文献 聚类分析文献综述 聚类算法文献外文翻译 聚类分论文

关于聚类算法论文范文 一种混合模糊聚类算法相关论文写作参考文献

分类:论文范文 原创主题:聚类算法论文 更新时间:2024-04-08

一种混合模糊聚类算法是关于对不知道怎么写聚类算法论文范文课题研究的大学硕士、相关本科毕业论文聚类算法 知识图谱论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

【摘 要】将传递闭包方法和FCM方法结合,提出一种混合模糊聚类算法,使其不需要预先设定聚类数目,并且能够降低它对初始化的敏感程度,收敛速度更快,且不用人为给定聚类类别数,不容易受初始化的影响.

【关键词】传递闭包 -统计量 模糊-均值聚类

聚类是按照一定的要求和规律对事物进行分类的过程,它根据研究对象的某些特性,运用数学方法对给定对象进行区分和分类.自Zadeh提出模糊集理论以来,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析.

现有的模糊聚类算法都是以某种准则来评价一个己给定划分的特性的,通常在参数输入、停机条件上存在诸多人为控制因素,这导致了用户在使用聚类方法时需要大量的数据分析领域知识.另外,有些聚类算法只能对某种分布数据聚类效果较好,对其它分布的数据聚类效果则很差.许多聚类算法是根据欧氏距离和Manhattan距离来进行聚类的,基于这类距离的聚类方法一般只能发现具有类似大小和密度的圆形或球状聚类.比如现在比较流行的-Means和模糊-Means聚类算法,既需要提供参数—聚类数目,而且对非球状或椭球型分布的数据集聚类效果不理想.因而需要设计一种好的聚类算法来提高算法的自主性和适应性,减少用户的参和.

一、传递闭包法聚类

(1)建立模糊相似矩阵.设X等于 {x1,x2,等,xn}为被分类对象的全体,设每一对象xi由一组特征数据(xi1,xi2,等,xim)来表征,于是可以得到原始数据矩阵Xnxm等于[xij].

为了使不同量纲的数据也能进行比较,常常需要将原始数据矩阵进行极差化或标准化.这里先将原始数据矩阵统一趋势化,得到无量纲矩阵X"nxm等于(x"ij),其中x.ij等于|xij-ui0|/iqr(xij)

iqr(xij)表示四分位极差.

按照普通的聚类方法中相似系数确定方法,建立模糊相似矩阵和,xi和xj的相似程度rij可根据实际情况采用相似系数法、距离法以及其它方法.

(2)由相似矩阵求等价矩阵.因为模糊等价矩阵能对论域进行等价的划分,这就能满足聚类分析的需要.然而,通常情况下,由标定过程构造出的模糊关系仅仅能满足自反性和对称性,而不满足传递性,所以生成的只是一个模糊相似矩阵R.为了进行分类,需要根据标定所得模糊矩阵R,求出其传递闭包t(R).R等于t(R)为模糊等价矩阵.

(3)进行聚类.将λ从1依次取到0,依次截得等价关系Rλ,并按Rλ将X分成等价类.

二、利用FCM算法得到最终分类

(1)确定FCM的聚类类别数c.将人从1依次取到0,形成一种动态聚类,便于全面了解样本聚类,然后根据实际需要选择某阈值λ,确定样本一种分类.如何合理选择阈值λ,笔者用F-统计量选择λ最佳值.F值越大,分类越合理,将这时的分类数目作为FCM的聚类类别数c.

(2) FCM算法.Step1:将F-统计值最大的阈值λ对应的分类数目r作为聚类类别数c,2≤c≤n,n是数据个数,给定加权指数m,设定迭代停止阈值ε,初始化聚类中心V(0),设置迭代计数器b等于0;

Step2:根据(式1.1)计算或更新划分矩阵U(b)等于[μik];

其中,dik为无量纲矩阵中X.第k个序列到第i类中心vi的欧氏距离.

Step3:根據(式1.2)更新聚类中心V(b+1):

Step4:如果‖V(b)-V(b+1)‖≤ε,则算法停止并输出划分矩阵U和聚类中心V;否则令b等于b+1,转向执行Step2.

若μjk等于max{μjk},则xk∈第j类.

同样,该算法也具有另一种形式,即从初始化模糊划分矩阵开始,先用(式1.2)计算聚类中心矩阵,然后用(式1.1)更新模糊分类矩阵,直到满足停止准则为止.

对比可知,这种混合模糊聚类法比传统FCM方法更切合实际,收敛速度更快,且不用人为给定聚类类别数,不容易受初始化的影响.

三、结论

本文针对经典的模糊C均值聚类算法需要事先确定聚类类数,设定初始聚类中心的缺点,提出改进的FCM算法,即一种混合模糊聚类算法.先利用传递闭包法得到一系列分类,再引入F-统计量,根据F-统计值的大小确定一种分类,以最大的F-统计值对应的一种分类的类数作为FCM聚类的类别数C,以这种分类的聚类中心作为FCM算法的初始聚类中心.此方法能够反映出原始数据的真实特性,真正达到聚类分析的无监督性;同时也降低了由于人为因素造成的不确定性影响,增强了聚类结果的准确性和可信度.

参考文献:

[1]高新波.模翊聚类分析及其英语[M].西安:西安电子科技大学出版社,2004.

[2]王洪春,彭宏.一种基于嫡的聚类算法[J].计算机科学,2007.

[3]路金芳,孙双全,杨建燕,伍化岩.统计学原理[M].河南:黄河水利出版社,2006.

[4]HALKIDI M,VAZIRGIANNIS M.A data set oriented approachfor clustering algorithm selection[C]//Proc of the 5th EuropeanConference on Principles of Data Mining and Knowledge Discov-ery.London:Springer Verlag,2001.

总结:本论文可用于聚类算法论文范文参考下载,聚类算法相关论文写作参考研究。

参考文献:

1、 基于聚类SIFT人脸检测算法 摘要:为解决在人脸识别领域的特征提取问题,提出一种尺度不变特征转换的SIFT算法与聚类分析相结合的算法,在对人脸特征分类时,通过选取最优化的距离。

2、 基于动态粒子群优化和Kmeans聚类图像分割算法 摘 要: 为了解决K?means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO。

3、 改进模拟退火算法K—means聚类方法在学生成绩上应用 【摘 要】本文以学生管理系统中学生的成绩作为测试集,提出一种新的基于改进模拟退火的k-means算法的评价函数,挖掘学生成绩中的有效数据,用改进。

4、 基于模糊聚类分析下达斡尔族传统工艺色彩提取 [内容摘要]本文以分类收集整理即将遗失相关达斡尔族的文化和传统工艺色彩,通过相关文献、影像资料进行研究,抽象选取达斡尔传统工艺色彩—单体器物色彩。

5、 基于聚类改进KANO模型B2C网站质量要素 [摘 要] B2C网站质量极大的影响其顾客购买意愿和使用黏性,同时随着市场竞争的日益激烈,对网站改善策略的思考也在不断丰富与深入。对于B2C网站。

6、 聚类分析在郫县烟草卷烟营销方面应用 摘 要:“大数据时代”的来临,为新时期郫县烟草的转型提升提供了创新的发展思路。为准确研判市场、实现精准营销,调研了郫县卷烟市场,用聚类分析、层次。