论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>技师论文>范文阅读
快捷分类: 聚类分析论文 a类期刊有哪些 机械类杂志 医药类期刊 国家级教育类期刊 交通类期刊 matlab聚类分析参考文献 聚类算法开题报告 聚类分析参考文献 聚类分析文献综述 聚类算法文献外文翻译 聚类分论文

关于聚类论文范文 聚类分析和判别分析在建筑业水平应用相关论文写作参考文献

分类:技师论文 原创主题:聚类论文 更新时间:2024-03-24

聚类分析和判别分析在建筑业水平应用是关于对不知道怎么写聚类论文范文课题研究的大学硕士、相关本科毕业论文聚类算法论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

【摘 要】采用SPSS多元统计软件中的聚类分析法把我国大陆28个省市地区建筑业水平按企业单位数、从业人员、建筑业总产值、技术装备率划分为5类进行聚类分析,并对聚类结果做相关研究,结果表明:在中国大陆地区的建筑业水平和四项因素息息相关.

Abstract:By using SPSS statistical software multivariate cluster analysis method to the mainland of China Construction levels 28 provinces and cities by number of business units, employees, construction output, technical equipment rates are divided into five categories of cluster analysis,and also do reserach in result.The results show that: in the construction level in mainland China and four factors are closely related.

【关键词】聚类分析;聚类结果;SPSS;

Keywords:Cluster analysis;Clustering results;SPSS;

0 引言

随着时代的进步,我国国民经济逐渐增强,而建筑业是我国国民经济的基础.预计到2015年,我国建筑业总产值将超过10万亿元,约占我国生产总值的7%.在重要机遇的同时,我国建筑业也会面临相应的问题.我国各个地方的GDP发展的水平都不一样,例如北京市,上海市经济发展的快,建筑业发展水平高,而内蒙古、西藏、新疆等省市则明显的建筑业水平不高,大多还在建设当中.一个省市的建筑业水平和四个因素相关,省市的企业单位数、从业人员、建筑业总产值、技术装备率.

1 参数选取和聚类分析方法

1.1 参数选取及数据来源

目前国内对建筑业统计的数据参数主要是4个,企业单位数(个)、从业人员(人)、建筑业总产值(万元)、技术装备率(元\人).本文系统聚类分析选取这四个方面的数据.研究地区为我国28个省市自治区.数据来源为中国建筑业2010年统计年鉴,详情见表1.

1.2聚类分析方法

聚类分析是数理统计中重要的数据分析方法.主要两种聚类法,分别是分层聚类法和迭代聚类法.聚类分析的目的就是在一些相似的基础上手机不同的数据进行分类.比如说聚类分析可以用来记录不同的客户群的特征,从而有利于销售者更好推销出产品.聚类分析还可以被应用到对动植物的基因进行分类,从而可以让我们对种群了解的更深.

聚类分析是由以下几个步骤组成,首先我们先寻找出所研究样品之间的相似性.由于在各个样品之间会存在一些联系彼此的指标,这些指标的量称为统计量.通过这些统计量,把相似程度高的归为一类,把另外一些相似程度大的分为第二类,直到把所有的样品都聚类完毕.

根据分类对象可以分为Q型聚类分析和R型聚类分析.Q型聚类分析主要是对样本进行分类处理,而R型聚类分析则是对变量进行分类处理.

系统聚类分析的基本思想是:设有n个样品,每个样品有m项指标.首先定义样品间的距离.先将这n个样品当做n个类别,由于两个类别之间都存在距离,将距离最近的两类合并成为新类,并计算新类和其它类的距离,再按最小距离准则并类.这样每次缩小一类,直到并成一类为止.

系统聚类方法:

(1)最短距离法:类和类之间距离为两类最近样品的距离.在原来的距离矩阵的非对角元素中找出,把分类对象归并为新的一类并计算各类和新类之间的距离,这样就能得到一个新的距离矩阵;再从新的矩阵中选出最小的归为新类,再计算距离,一直反复,直到各个分类对象被归为一类.

(2)最长距离法:则是贺最短距离法相反,最远距离聚类法所用的是最远距离来衡量样本之间的距离;

(3)直接聚类法:先把各个分类对象单独看作一类,根据距离最小原则,依次选出一对分类对象,并成新类.如果分类对象中有一个已经是其中一类,那么把另一个也归为此类;每一次归类都划掉该对象所在的列和对应的行.经过m-1次就可以把全部分类对象归为一类.

(4)重心法:以两类重心之间的距离作为两类间的距离.重心法测量的是两个类的重心(均值)之间的欧氏距离.每合并一次类,都要重新计算新类的重心

(5)类平均法:以两类元素两两之间距离平方的平均作为类间距离的平方.

2 系统聚类分析成

3缺失数据及判别分析

调查中经常遇到缺失数据的现象.产生缺失数据的原因有多种,不同背景下的缺失数据对统计分析会带来不同的影响.提高统计调查数据的质量,一方面要采取有效措施减少数据缺失,提高调查的回答率;另一方面,当出现缺失数据时,可以对不完整的数据集进行处理,以减小由于缺失数据带来的影响.对缺失值有不同的调整方法,不同的方法各有特点.在上述的28个省市数据里面中,没有包括江西省、山东省、河南省三个省份.现在是已知三个省份的四项相关因素的指标,要求得到底三个省份归类于哪类.

判别分析是用于判断个体所属类别的一种统计方法.判别分析是根据已知观测对象的分类和若干表明观测对象特征的变量值,建立判别函数和判别准则,并使其错判率最小.

判别分析即“分辨法”,是指的已经分类确定了,根据某个研究对象的特征值来确定类型归属问题.判别分析的基本原理是根据一定的准则,建立单独的或者是好几个判别函数,然后确定函数中的待定系数,计算出指标最后判别类别.

总结:本文是一篇关于聚类论文范文,可作为相关选题参考,和写作参考文献。

参考文献:

1、 因子、聚类判别分析在烟叶风格特色评价中应用 摘 要:为合理评价烟叶风格特征及不同风格特征烟叶区域分类,采用因子、聚类及判别分析相结合的方法,对河南31个产烟县的169个烟叶样品的风格特征指。

2、 大型办公建筑照明插座系统电耗逐时率聚类分析 摘要:逐时使用率对于预测办公建筑照明与插座系统电耗,以及核定节能改造的节能量有十分重要的意义。选取重庆17幢办公建筑作为研究对象,根据建筑全年。

3、 基于K—MEANS聚类电商店铺经营策略分析 ◆中图分类号:F272 文献标识码:A内容摘要:本文在对电商店铺商品价格、相关商品数和月销量等数据的挖掘中,建立基于K-MEANS的店铺聚类研。

4、 基于聚类分析智慧城市事部件数据 [摘 要]在智慧城市的建设过程中,大量运行数据伴随着城市管理事部件的处置产生并积累。为分析此类数据,本文利用聚类分析技术,以温岭市太平街道为例,。

5、 基于聚类改进KANO模型B2C网站质量要素 [摘 要] B2C网站质量极大的影响其顾客购买意愿和使用黏性,同时随着市场竞争的日益激烈,对网站改善策略的思考也在不断丰富与深入。对于B2C网站。

6、 聚类分析在郫县烟草卷烟营销方面应用 摘 要:“大数据时代”的来临,为新时期郫县烟草的转型提升提供了创新的发展思路。为准确研判市场、实现精准营销,调研了郫县卷烟市场,用聚类分析、层次。