当前位置:主页 > 社科论文 > 图书档案论文 >

基于特征识别与实证分析的热点事件识别技术研究

发布时间:2024-04-23 00:35
  网络热点事件反映了社会动态、民生意愿,受到社会各界广泛关注,但是新闻门户网站中存在大量冗余的信息,人工的方式难以有效获取网络热点事件相关信息,且部分网络热点事件爆发迅速、影响巨大,人们需要及时了解事件发展态势。因此人们需要计算机能够在大量的新闻信息中自动发现网络热点事件,甚至在网络事件的早期对热点事件进行识别。网络热点事件识别技术受到研究者们的广泛关注,很多研究者使用不同的文本表示模型提升了热点事件识别的效果,根据已发生事件和新发生事件之间的相似性预测新发生事件的热度。但是在新闻领域中,提升网络热点事件识别效率的研究较少,网络热点事件早期识别方法的研究还有所欠缺。本文实证分析网络热点事件特征及网络事件早期特征,基于网络热点事件特征改进文本表示方法从而提升网络热点事件的识别效率,同时基于网络事件早期特征提出网络热点事件早期识别方法。本文的研究内容及贡献如下所示:(1)提出了KSSP网络热点事件识别方法。本文基于多源新闻爬虫系统采集的新闻数据,实证分析了网络热点事件的特征。研究发现网络热点事件讨论的话题不止一个,在话题偏移的过程中,新话题的部分文本会在文本的开头对其他话题进行简短的阐述。根...

【文章页数】:93 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景与研究意义
    1.2 国内外研究现状
        1.2.1 网络热点事件识别技术
        1.2.2 网络热点事件早期识别技术
    1.3 论文研究内容
    1.4 论文组织结构
第二章 相关理论和技术
    2.1 网络爬虫技术
        2.1.1 网络爬虫概述
        2.1.2 网络爬虫的分类
        2.1.3 网络爬虫原理
    2.2 文本预处理技术
        2.2.1 文本分词
        2.2.2 文本表示
        2.2.3 常用向量距离计算公式
    2.3 机器学习聚类方法简介
        2.3.1 K-Means
        2.3.2 Mini Batch KMeans
        2.3.3 DBSCAN
        2.3.4 Single-Pass
    2.4 网络热点事件定义
        2.4.1 二八定律
        2.4.2 网络热点事件
    2.5 机器学习分类方法简介
        2.5.1 逻辑回归
        2.5.2 决策树
        2.5.3 SVM
        2.5.4 K近邻
        2.5.5 朴素贝叶斯
    2.6 本章小结
第三章 KSSP网络热点事件识别方法
    3.1 网络热点事件特征
        3.1.1 网络热点事件话题数量
        3.1.2 网络热点事件话题间的联系
    3.2 KSSP网络热点事件识别方法
        3.2.1 新闻文本表示及相似度计算方法
        3.2.2 KSSP网络热点事件识别方法描述
    3.3 实验设计与结果分析
        3.3.1 实验数据集与实验设置
        3.3.2 实验评价指标
        3.3.3 实验平台
        3.3.4 实验结果与分析
    3.4 本章小结
第四章 基于网络事件早期特征的热点事件早期识别方法
    4.1 数据准备
        4.1.1 数据采集与筛选
        4.1.2 网络事件热度计算公式
    4.2 网络事件早期定义
        4.2.1 网络热点事件生命周期
        4.2.2 网络事件早期定义
    4.3 网络事件热度影响因素表现特征
        4.3.1 媒体发布的新闻数均值
        4.3.2 媒体关注度
        4.3.3 极端情绪占比
        4.3.4 用户关注度
    4.4 网络热点事件特征有效性验证
        4.4.1 网络热点事件特征中的异常值
        4.4.2 差异显著性检验
    4.5 网络事件早期特征
        4.5.1 网络事件早期特征研究数据集
        4.5.2 网络事件早期特征
    4.6 基于网络事件早期特征的热点事件早期识别方法
    4.7 实验设置与实验结果分析
        4.7.1 实验数据集
        4.7.2 实验对比方法
        4.7.3 实验评估方法
        4.7.4 实验结果与分析
    4.8 本章小结
第五章 网络热点事件识别技术的应用
    5.1 基于大规模新闻数据的舆情定制系统
        5.1.1 系统开发背景介绍
        5.1.2 舆情定制系统功能介绍
        5.1.3 系统难点
    5.2 成果应用及系统功能展示
        5.2.1 成果应用
        5.2.2 系统功能展示
    5.3 本章小结
第六章 总结和展望
    6.1 工作总结
    6.2 未来工作展望
致谢
参考文献
附录 作者在读期间发表的学术论文及参加的科研项目
详细摘要



本文编号:3962359

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3962359.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ae938***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]