PCA-PSO-FCM在短文本聚类中的研究与应用

发布时间:2022-01-07 02:42
  当下社交网络高速发展,各类信息数量成指数式的爆发增长,人们生活,社交,娱乐,阅读更加依赖于社交网络。为了满足人们日益增长的快速获取信息的需求,互联网中诞生了诸如微博,豆瓣,知乎,今日头条等媒体。这类媒体通过给用户推送短文本信息,使得用户得以在短时间内,迅速了解时下社会问题,热点新闻,重要事件等与生活息息相关的信息。随着这类短文本信息量不断的积累,这其中蕴含的大量有价值的信息对人们的日常的生活,工作,学习,有着不小的影响。并且对经济,文化,政治等多个方面有着重大的研究意义。对这类短文本数据进行精准且有效的聚类,对舆情监测,广告投放,情感分析,文本分类等领域,有着先导作用和应用的价值。因此,对于海量的短文本信息数据的聚类研究,是存在着实际意义和研究前景的。短文本与长文本相比,文本长度短,词汇个数少。在整体的信息量不降低的前提下,短文本的单个词具有高信息量,高概括性。传统基于词向量特征空间模型,将短文本转换成稀疏的空间词特征矩阵,在处理大量数据时,会面临空间复杂度高,特征矩阵稀疏度高,针对噪声的抵抗弱,鲁棒性低的问题。利用word2vec结合文本卷积神经网络的方法将文本信息压缩,极大程度的保... 

【文章来源】:南华大学湖南省

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

PCA-PSO-FCM在短文本聚类中的研究与应用


CNN模型图

维度,成分,步骤,模型算法


28法的适用性,增强算法的聚类效果,弥补PSO-FCM算法鲁棒性弱的不足。112222()(())(())1(1)(())0iiiiiivtcxtcxttvtcxtt,,…(3.14)1122=r,=r……………………………………(3.15)图3.1高主成分贡献维度图3.2低主成分贡献维度3.2.2PSO‐FCM模型算法步骤PCA-PSO-FCM的具体步骤如下:

维度,成分,步骤,模型算法


28法的适用性,增强算法的聚类效果,弥补PSO-FCM算法鲁棒性弱的不足。112222()(())(())1(1)(())0iiiiiivtcxtcxttvtcxtt,,…(3.14)1122=r,=r……………………………………(3.15)图3.1高主成分贡献维度图3.2低主成分贡献维度3.2.2PSO‐FCM模型算法步骤PCA-PSO-FCM的具体步骤如下:


本文编号:3573646

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3573646.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ec81a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com