当前位置:主页 > 管理论文 > 移动网络论文 >

基于微博平台的新兴热点话题检测研究

发布时间:2023-12-12 20:20
  微博,一个基于用户社交关系为用户提供信息获取、分享以及传播服务的新型社交网络平台,是随着互联网技术的发展,以及用户的实际需求应运而生的。目前,基于微博平台数据的信息挖掘,商务产品的微博营销,公众舆论情感挖掘等研究层出不穷,旨在通过利用微博平台上的海量数据挖掘有价值的信息,实现政法部门的社会监管,实现企业产品的市场推广,实现智慧城市的发展。本文的主要研究内容是基于微博用户和文本数据挖掘出指定时间段内的新兴热点话题。主要流程如下:首先,借鉴Page Rank算法基本思想基于用户关注关系网络计算用户权威值;然后,基于关键词建立生命周期模型,并通过用户的权威值和关键词的权重计算关键词的营养值,再引入时间框架将营养值转化为能量值,挖掘出新兴热点关键词;最后,利用关键词之间的语义关系构建话题图,并以新兴热点关键词为语义中心利用图的遍历算法找出一组与之语义相关的关键词作为话题集,计算话题的能量值挖掘出新兴热点话题。本文的最后一部分使用真实的微博数据进行实验,验证算法的有效性。本文的主要贡献有:1.提出了一种基于关键词的能量值计算方法和基于PageRank思想的用户权威值计算方法。本文将话题细化为一组...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 本文研究内容
    1.4 本文组织结构
第二章 微博关键技术分析
    2.1 话题与微博平台
        2.1.1 微博文本特征
        2.1.2 用户特征
        2.1.3 信息传播特征
    2.2 话题检测的相关技术
        2.2.1 微博数据抓取与预处理
        2.2.2 基于TF*PDF的向量模型
        2.2.3 文本相似度
        2.2.4 PageRank算法
        2.2.5 基于老化理论的生命周期模型
    2.3 本章小结
第三章 新兴热点话题检测
    3.1 微博文本向量表示
    3.2 基于用户关系网络的用户权威值计算
    3.3 基于老化理论的关键词热量计算
        3.3.1 基于用户权威性的关键词营养值计算
        3.3.2 关键词能量值计算与新兴热点词的选择
    3.4 基于语义关联的新兴热点话题检测
        3.4.1 关键词的相关向量
        3.4.2 基于关键词的语义关联结构图与新兴热点话题检测算法 .. 29
    3.5 本章小结
第四章 实验及结果分析
    4.1 实验环境及平台
    4.2 实验数据说明
    4.3 实验过程及结果
    4.4 本章小结
结论与展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件



本文编号:3873572

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3873572.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户7442f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com