基于卷积神经网络的文本分类算法研究

发布时间:2024-03-06 06:17
  随着信息技术的发展,互联网数据及资源呈现海量特征,文本信息也正爆炸式的增长。如何快速准确的从海量的数据中筛选出所需的资料和信息,文本分类在内容信息过滤筛选和自然语言处理等领域都发挥着非常重要的作用。本文基于CNN文本分类模型做了大量的研究与改进探索,提出了两种切实可行的改进算法,并进行了大量的实验分析。首先,针对互联网短文本具有长度短、特征稀疏以及上下文依赖性强等特点,提出了一种基于字符级嵌入的卷积神经网络和长短时记忆网络相结合的神经网络模型进行短文本的分类。该模型集成了高速公路网络框架,用于缓解深度神经网络训练时的困难,提高分类的准确性。通过对几种数据集的测试,结果表明提出的模型在短文本分类任务中优于传统模型和其他基于CNN的分类模型。其次,针对经典CNN句子分类模型在处理较长文本任务中的缺陷,保存CNN模型并行化的优势,借助LSTM的门控机制,改进了多层神经网络中层与层之间的联系,进一步优化文本的语义表示。提出一种基于门控卷积神经网络的文本分类算法。实验表明,该算法在中英文数据集上都能有效提升其在文本分类任务中的性能。最后,在上述字符级嵌入文本分类算法研究的基础上,本文进一步研究了...

【文章页数】:84 页

【学位级别】:硕士

【部分图文】:

图3准确率对比情况

图3准确率对比情况

第44卷第7期殷亚博,杨文忠,杨慧婷,等:基于卷积神经网络和KNN的短文本分类算法研究图3准确率对比情况图4召回率对比情况图5F1值对比情况由表5可知,从分类准确率上来看,CNN算法除了在数据集DBMC-1上分类效果比CKNN算法的分类效果明显好之外,在剩下的数据集中两者的分类效....


图4召回率对比情况

图4召回率对比情况

第44卷第7期殷亚博,杨文忠,杨慧婷,等:基于卷积神经网络和KNN的短文本分类算法研究图3准确率对比情况图4召回率对比情况图5F1值对比情况由表5可知,从分类准确率上来看,CNN算法除了在数据集DBMC-1上分类效果比CKNN算法的分类效果明显好之外,在剩下的数据集中两者的分类效....


图2.4支持向量机??Fi2.4?Suort?vector?machines??

图2.4支持向量机??Fi2.4?Suort?vector?machines??

?基于多粒度特征表示及循环卷积神经网络的短文本分类研究??图2.3反向传播算法图??Fig?2.3?Back?propagation?algorithm?diagram??2.3.6支持向量机??支持向量机最初是由Vapnik等人提出的学习模型KIWI,?JoachimsNl于1....


图2-3向量空间模型

图2-3向量空间模型

图2-3向量空间模型Figure2-3Vectorspacemode,VSM空间模型如图2-3所示。设D为一个包含m个文的特征向量,则有D=,T=区间,(==)为文档....



本文编号:3920681

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3920681.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户88cc1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]