当前位置:主页 > 科技论文 > 搜索引擎论文 >

若干改进近邻传播聚类算法及其应用

发布时间:2017-08-26 01:07

  本文关键词:若干改进近邻传播聚类算法及其应用


  更多相关文章: 近邻传播聚类算法 熵权法 主成分分析法 贴近度 布谷鸟优化算法 半监督学习


【摘要】:机器学习是人工智能的核心。它是根据以往的经验学习优化计算机算法性能的过程。目前,它已成功应用于自然语言处理、生物信息学、搜索引擎、医学诊断、信息安全、证券市场分析、语音和手写识别等领域。机器学习按照学习形式可分为无监督学习和监督学习。聚类分析是无监督学习的一个重要分支。近邻传播(Affinity Propagation,AP)聚类算法是Frey等人于2007年在《Science》提出的一种新的聚类算法,该算法具有结果不受初始类代表点的选择、稳定性强和迭代速度快等优势。目前该算法已成功应用于诸多领域,但是它仍然存在一些弊端,因此,对近邻传播聚类算法进行理论改进和应用研究具有重要意义。本文主要研究内容如下:(1)传统近邻传播聚类算法对高维数据进行聚类分析时,由于“维度效应”难以找到恰当的类结构,导致聚类失效,鉴于此,本文提出一种基于熵权法和主成分分析法的近邻传播聚类算法(The Entropy Weight Method and Principal Component Analysis Affinity Propagation,EWPCA-AP)。该算法引用熵权法对样本数据赋权,利用主成分分析法消除无关属性,并与近邻传播聚类算法相融合,实现高维数据在低维空间聚类。通过仿真实验数值结果表明:本文提出的EWPCA-AP聚类算法能够有效地消除数据的冗余性、剔除无关属性,提高聚类效果。此外,本文将提出的EWPCA-AP聚类算法应用于我国经济评价领域,获得的聚类结果与实际情况相一致,这为我国经济领域提供一种新的智能评价方法。(2)距离贴近度是模糊数学的重要函数之一,相比欧氏距离,距离贴近度有消除量纲影响的优势,能更好的反应奇异样本数据空间特征。本文将距离贴近度的思想引入到相似度量函数中,与传统的近邻传播聚类算法相融合,提出一种基于距离贴近度的近邻传播聚类算法(Close Measures Affinity Propagation,CM-AP)。通过UCI数据集实验数值结果表明:本文提出的CM-AP聚类算法具有很好的鲁棒性,能有效地消除量纲影响,提高聚类效果,同时,拓宽算法处理多种数据的能力。另外,本文将提出的CM-AP聚类算法用于我国上市公司绩效评价领域,取得的聚类结果与实际相符合,这为投资者做出合理的投资提供可靠的依据,帮助投资者理性投资、减少投资风险。(3)布谷鸟优化算法是一种新的、参数少、寻优能力强的群体智能优化算法。由于近邻传播聚类性能受初始偏向参数选择的影响,本文将布谷鸟优化算法和近邻传播聚类算法相融合,提出一种基于布谷鸟优化的半监督近邻传播聚类算法(Semi-supervised Affinity Propagation Based on Cuckoo Search,CS-SAP)。该算法引入半监督思想,指导相似度矩阵更新,通过布谷鸟优化算法自适应扫描偏向参数空间获取最优值。通过仿真实验结果表明:CS-SAP聚类算法与预期期望的结果相符合,聚类性能明显提高。近几十年来,在全局优化计算领域出现许多新的群体优化算法,它们能够更好地模拟人类的智能实现数据智能化处理,并成功应用于诸多领域。因此,研究此高效的智能数据挖掘技术更具有意义和价值。
【关键词】:近邻传播聚类算法 熵权法 主成分分析法 贴近度 布谷鸟优化算法 半监督学习
【学位授予单位】:吉林财经大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13
【目录】:
  • 摘要4-6
  • ABSTRACT6-10
  • 第1章 绪论10-16
  • 1.1 选题背景10-11
  • 1.2 国内外研究现状11-13
  • 1.3 本文主要研究内容13-14
  • 1.4 本文主要创新点14-16
  • 第2章 机器学习及近邻传播聚类算法相关理论16-29
  • 2.1 机器学习简介16-17
  • 2.2 近邻传播聚类算法的原理17-20
  • 2.2.1 近邻传播聚类算法的基本流程17-19
  • 2.2.2 算法的重要参数19-20
  • 2.3 相似性度量方法20-23
  • 2.3.1 基于距离的相似度20-22
  • 2.3.2 基于密度的相似度22
  • 2.3.3 基于连接的相似度22-23
  • 2.4 聚类有效性评价方法23-28
  • 2.4.1 外部评价法23-24
  • 2.4.2 内部评价法24-25
  • 2.4.3 相对评价法25-28
  • 2.5 本章小结28-29
  • 第3章 基于熵权法和主成分分析法的近邻传播聚类算法及其应用29-43
  • 3.1 引言29-30
  • 3.2 熵权法30-33
  • 3.2.1 熵权法的基本原理30
  • 3.2.2 基于熵权的权重计算法30-31
  • 3.2.3 主成分分析法31-33
  • 3.3 基于熵权法和主成分分析法的近邻传播聚类算法及其应用33-41
  • 3.3.1 基于熵权法和主成分分析法的近邻传播算法流程33-35
  • 3.3.2 实验模拟与结果分析35-37
  • 3.3.3 我国各地区经济绩效评价37-41
  • 3.4 本章小结41-43
  • 第4章 基于距离贴近度的近邻传播聚类算法及其应用43-55
  • 4.1 引言43
  • 4.2 贴近度法43-44
  • 4.3 基于距离贴近度的近邻传播聚类算法及其应用44-54
  • 4.3.1 基于距离贴近度的近邻传播聚类算法流程44-45
  • 4.3.2 实验模拟与结果分析45-48
  • 4.3.3 上市公司经济绩效评价48-54
  • 4.4 本章小结54-55
  • 第5章 基于布谷鸟优化的半监督近邻传播聚类算法55-65
  • 5.1 引言55
  • 5.2 布谷鸟优化算法简介55-57
  • 5.3 半监督聚类算法简介57-58
  • 5.4 基于布谷鸟优化的半监督近邻传播聚类算法58-64
  • 5.4.1 基于布谷鸟优化的半监督近邻传播聚类算法流程59
  • 5.4.2 实验模拟与结果分析59-64
  • 5.5 本章小结64-65
  • 第6章 结论与展望65-67
  • 攻读硕士学位期间已公开发表的论文67-68
  • 参考文献68-72
  • 致谢72

【相似文献】

中国期刊全文数据库 前10条

1 葛磊;武芳;王鹏波;张冬林;;3维建筑综合中基于最小特征的面平移算法[J];测绘科学技术学报;2009年02期

2 骆雯,孙延明,陈振威,陈锦昌;判断点与封闭多边形相对关系的改进算法[J];机械;1999年03期

3 李林;卢显良;;一种基于切割映射的规则冲突消除算法[J];电子学报;2008年02期

4 刘巧玲;张红英;林茂松;;一种简单快速的图像去雾算法[J];计算机应用与软件;2013年07期

5 林亚平,杨小林;快速概率分析进化算法及其性能研究[J];电子学报;2001年02期

6 章郡锋;吴晓红;黄晓强;何小海;;基于暗原色先验去雾的改进算法[J];电视技术;2013年23期

7 杨铁军;靳婷;;一种动态整周模糊值求解算法及其仿真分析[J];系统工程与电子技术;2007年01期

8 周秀玲;郭平;陈宝维;王静;;几种计算超体积算法的比较研究[J];计算机工程;2011年03期

9 吴一戎,胡东辉,彭海良;Chirp Scaling SAR成象算法及其实现[J];电子科学学刊;1995年03期

10 王贵竹;一种产生单向分解值的算法[J];安徽大学学报(自然科学版);2001年03期

中国重要会议论文全文数据库 前10条

1 尹冀锋;;一种新的图象自适应增强算法[A];四川省通信学会一九九二年学术年会论文集[C];1992年

2 宁春平;田家玮;郭延辉;王影;张英涛;郑桂霞;刘研;;计算机辅助增强、分割算法在鉴别乳腺良、恶性肿块中的应用价值[A];中华医学会第十次全国超声医学学术会议论文汇编[C];2009年

3 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

4 郑存红;;复杂背景下相关跟踪算法研究及DSP实现[A];中国光学学会2010年光学大会论文集[C];2010年

5 杨文杰;吴军;;RFID抗冲突算法研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

6 高山;毕笃彦;魏娜;;一种基于UPF的小目标TBD算法[A];第十四届全国图象图形学学术会议论文集[C];2008年

7 周磊;张卫华;王晓奇;张军;;基于流水算法的智能路障机器人设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年

8 潘巍;李战怀;陈群;索博;李卫榜;;面向MapReduce的非对称分片复制连接算法优化技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

9 李伟伟;蔡康颖;郑新;王文成;;3D模型中重复结构的多尺度快速检测算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

10 杨任尔;陈恳;励金祥;;基于棱边方向检测的运动自适应去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

中国重要报纸全文数据库 前1条

1 国泰君安资产管理部;“算法交易”是道指暴跌罪魁祸首?[N];上海证券报;2010年

中国博士学位论文全文数据库 前10条

1 冯辉;网络化的并行与分布式优化算法研究及应用[D];复旦大学;2013年

2 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年

3 李琰;基于猫群算法的高光谱遥感森林类型识别研究[D];东北林业大学;2015年

4 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年

5 王洋;基于群体智能的通信网络告警关联规则挖掘算法研究[D];太原理工大学;2015年

6 雷雨;面向考试时间表问题的启发式进化算法研究[D];西安电子科技大学;2015年

7 熊霖;大数据下的数据选择与学习算法研究[D];西安电子科技大学;2015年

8 周雷;基于图结构的目标检测与分割算法研究[D];上海交通大学;2014年

9 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年

10 蒋亦樟;多视角和迁移学习识别方法和智能建模研究[D];江南大学;2015年

中国硕士学位论文全文数据库 前10条

1 姚鑫宇;EMD去噪与MUSIC算法在DOA估计中的联合应用[D];昆明理工大学;2015年

2 陆进;面向含噪数据聚类相关算法的研究[D];复旦大学;2014年

3 李家昌;基于能量约束的超声图像自动分割算法[D];华南理工大学;2015年

4 陈坚;基于密度和约束的数据流聚类算法研究[D];兰州大学;2015年

5 高健;基于Zynq7000平台的去雾算法研究及实现[D];南京理工大学;2015年

6 顾磊;基于Hadoop的聚类算法的数据优化及其应用研究[D];南京信息工程大学;2015年

7 杨燕霞;基于Hadoop平台的并行关联规则挖掘算法研究[D];四川师范大学;2015年

8 王羽;基于MapReduce的社区发现算法的设计与实现[D];南京理工大学;2015年

9 许振佳;流式数据的并行聚类算法研究[D];曲阜师范大学;2015年

10 董琴;人工蜂群算法的改进与应用[D];大连海事大学;2015年



本文编号:738698

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/738698.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户938df***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com