当前位置:主页 > 科技论文 > 自动化论文 >

基于融合粒子群与k-means算法在微博舆情监测方面的应用

发布时间:2023-10-06 08:14
  在互联网运用越来越普及的今天,社交网络积累了大批的网民用户,尤其是微博凭借着内容丰富、文字简略、发布快速等方面的优势,受到大量网民的喜爱,占据了主流媒体的位置。微博每天都会产生海量的数据,这些数据包含巨量的信息,如何挖掘出这些信息并找到所需的部分有着重大的现实价值和作用。本文采用数据挖掘技术处理微博数据,找到民众关注的热点话题,对网络上的言论进行跟踪监控,从而创造文明健康的网络环境,获取有效信息,为商业价值、信息传播和社会学研究提供依据,将网络舆论朝向进行积极健康的引导发展,为实现社会和谐提供更为有力的保障。本文以新浪微博的数据作为研究对象。首先是要将数据执行可视化操作,这样能基本确定数据的分布特性,以便于完成数据预处理。因为新浪微博的数据十分庞杂,且其中大部分是高于三维的数据,所以对很难对微博进行直观判断。本文通过k-means算法将数据执行聚类分析,但是因为k-means算法较为容易受到初始中心点的影响,存在对数据执行迭代求解的过程中,遇到局部最优解的问题。为了解决这些问题,本文在计算过程中加入了粒子群(PSO)算法,改进后的算法,减少了参数设置,可以加速算法收敛速度,提高聚类效果...

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 论文研究的目的和意义
    1.2 相关内容研究现状
        1.2.1 舆情监测研究现状
        1.2.2 微博特征的研究现状
        1.2.3 聚类算法的研究现状
    1.3 本文的主要工作及论文的组织结构
    1.4 论文章节安排
第2章 相关理论基础
    2.1 数据挖掘
        2.1.1 数据挖掘概述
        2.1.2 数据挖掘的实现过程和技术分类
    2.2 聚类分析
        2.2.1 聚类分析概述
        2.2.2 不同的聚类类型
        2.2.3 主要的聚类算法
        2.2.4 聚类评价的比较
    2.3 微博相关知识
        2.3.1 微博定义及用户特点
        2.3.2 微博挖掘的相关原理
    2.4 k-means算法
        2.4.1 算法思想
        2.4.2 算法的特点
    2.5 粒子群优化算法
        2.5.1 算法的原理
        2.5.2 算法流程
第3章 基于融合粒子群的k-means算法
    3.1 相关工作分析
    3.2 基于融合粒子群优化的k-means算法
        3.2.1 粒子群编码方案及适度评价
        3.2.2 粒子群算法的参数设置
        3.2.3 粒子变异操作
        3.2.4 改进算法的描述
    3.3 实验
第4章 系统设计与实现
    4.1 功能需求分析
    4.2 系统概述
        4.2.1 开发环境
        4.2.2 系统框架
    4.3 系统设计
        4.3.1 微博模拟登陆
        4.3.2 信息采集
        4.3.3 分词
        4.3.4 主题词抽取
        4.3.5 文本聚类
    4.4 系统实现
        4.4.1 系统界面
        4.4.2 对微博信息的采集
        4.4.3 微博数据分析
结论
参考文献
致谢



本文编号:3851472

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3851472.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户e5a5e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com