结合评论关系网络图的微博垃圾评论识别方法研究

发布时间:2024-01-29 12:20
  伴随着微博平台影响力的不断扩大,大量无意义带有广告营销、恶意攻击言语性质的垃圾评论信息充斥在平台中,威胁着平台本身发展的稳定与和谐。因此,如何在已有垃圾评论识别研究的基础之上提高垃圾评论整体的识别率以及降低垃圾评论和正常评论的误判率是面向微博平台垃圾评论识别研究中的重点内容。提出一种结合评论关系网络图的微博垃圾评论识别方法,在建立评论关系网络图模型的基础之上,采用文本相关度计算模型代替传统严苛的文本相似度计算模型,将评论与原博文的相关关系考虑进来,降低正常相关评论的误判率。文本相关度又由底层实现基于Lucence全文搜索引擎的微博语料全文搜索库词语相关度计算而来,该方法结合了传统基于搜索引擎和语料库两种词语相关度计算方法以适用于评论关系网络图中的文本词之间相关度计算。在评论文本特征不够丰富的情况下,通过用户共同属性、用户交互频度、用户间互评估可信度模型量化评论关系网络图中评论两端用户友好关系以及评论用户可信度,利用用户关系越友好、用户可信度越高,相互之间发表垃圾评论概率越低的性质提高垃圾评论识别算法的准确率。并且为了提升垃圾评论识别算法的性能,选择基于图模型的图数据库来存储和管理包含各...

【文章页数】:67 页

【学位级别】:硕士

图3.4评论关系网络图Neo4j存储

图3.4评论关系网络图Neo4j存储


图3.9文本分词示例

图3.9文本分词示例



本文编号:3888175

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3888175.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户20762***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]