短文本情感倾向性分析算法研究

发布时间:2023-12-25 12:16
  随着互联网技术日新月异的更迭与发展,越来越多的网络社交平台开始在普通民众的生活中占据重要的分量。网络的发展为人们生活带来便利,拓宽了人们的视野,也构建出一个新型的社交空间和社交模式。现在,人们通过新浪微博等平台积极参与互动,发表见解。对时事的讨论,新浪微博已经发展众多网民网络生活的重要阵地。在进行网络活动的过程中,人们发布的微博,回复的内容,转发的评论等文字载体都是人们情感倾向的具象化表现,对这些文本进行情感倾向性分析对政府部门把控当前舆论主流,制定相关政策有很大帮助,企业也可以通过相关评论调整经营策略。本文即是面向新浪微博热点事件进行情感倾向性分析研究。传统的情感倾向性分析一般利用情感词典或是通过机器学习对文本进行情感倾向性的分类判别,在情感分类精度上存在不足,缺陷很明显。本文对这两种方法进行相应的改进,并综合二者进行新浪微博热点事件的情感倾向性分析,相关的改进内容如下:1)数据获取方式。新浪微博在其开发者平台提供了 API接口,但考虑到API接口数据获取速度太慢,并且对数据获取量有限制,本文增加了爬虫方式进行新浪微博文本的获取渠道。2)基于词典的情感倾向性分析。本文首先选取了目前主...

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 课题背景与意义
    1.2 国内外研究现状
        1.2.1 国外发展及现状
        1.2.2 国内发展及现状
    1.3 论文研究内容
    1.4 论文组织结构
    1.5 本章小结
第二章 相关技术研究
    2.1 情感倾向性分析的总体流程
    2.2 微博文本数据
    2.3 文本预处理
        2.3.1 文本的初筛选
        2.3.2 中文分词
        2.3.3 去停用词
    2.4 语料库
    2.5 情感倾向性分析方法
        2.5.1 基于词典的情感倾向性分析方法
        2.5.2 基于机器学习的情感倾向性分析方法
    2.6 本章小结
第三章 基于扩充词典集的情感倾向性分析
    3.1 情感词典
    3.2 词典集构建
        3.2.1 基础情感词典的构建
        3.2.2 网络新词情感词典构建
        3.2.3 程度副词词典构建
        3.2.4 否定词典构建
    3.3 词的表达
        3.3.1 词的表示方式
        3.3.2 词向量模型
        3.3.3 Word2vec模型
    3.4 基于Word2vec与点互信息结合的词典扩充方法
        3.4.1 SO-PMI算法
        3.4.2 情感词典的扩充
    3.5 分类性能评价指标
    3.6 本章小结
第四章 基于FastText与分类结合的情感倾向性分析
    4.1 FastText模型
    4.2 分类器
        4.2.1 最近邻算法
        4.2.2 支持向量机
        4.2.3 GBDT
        4.2.4 IDBKnn算法
        4.2.5 分类器效能验证
    4.3 基于FastText与IDBKnn结合的情感倾向性分析
    4.4 本章小结
第五章 实验结果与分析
    5.1 实验数据
    5.2 实验评价指标
    5.3 基于情感词典的情感倾向性分析
    5.4 基于机器学习的情感倾向性分析
    5.5 基于情感词典与机器学习结合的情感倾向性分析
    5.6 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
致谢
参考文献
攻读硕士学位期间取得的研究成果



本文编号:3875221

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3875221.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ccaae***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com