当前位置:主页 > 科技论文 > 自动化论文 >

基于改进粗糙集模型的文本分类方法优化研究

发布时间:2024-03-18 18:44
  文本分类是指按照一定的分类体系或标准将未知文本区分一个或多个类别的过程.当前文本数据逐步呈现出海量、多元、易变等新特性,给文本分类技术带来巨大挑战.粗糙集在处理数据的不确定性和模糊性等问题上,具有天然的优势,其主要思想是在不削减分类能力的前提下,通过属性约简得到基本的决策和分类规则.针对上述相关问题,本文通过对粗糙集的研究,结合文本分类现有的技术,提出了一种新的文本分类方法.具体研究工作如下:首先,通过对差异关系的研究,本文提出了改进的差异关系和限制差异关系.在构建关系的过程中,结合容差粗糙集的边界控制理念,重新定义了属性间差异度的概念.基于改进的差异关系,构建了不完备信息系统中的拓展粗糙集模型,一定程度上解决了粗糙集知识粒度过粗和经典粗糙集对复杂数据处理的局限性等问题.其次,在改进差异关系上引入采用错误分类率的变精度粗糙集,构建了改进差异关系的变精度粗糙集模型,较好地解决了数据中存在的噪声问题.较传统的变精度粗糙集,提高了粗糙集的分类精度,分类结果更加合理、精确.在改进粗糙集的基础上提出了改进的属性约简算法,化解了数据的高维危机,提高分类决策能力.采用UCI中的数据集开展数值实验,改...

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

图4-1不同模型下的查准率

图4-1不同模型下的查准率

集上的数值实验据库中的Irsi数据,其数据类别包含3类,setosa,versic本,每个样本有4个属性.通过自助法将初始数据集D机选取,在risi的基础之上构建不完备的数据集.通过样本集S确定τ=0.45,β=0.92.将测试集样本量T....



本文编号:3931652

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3931652.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户7c418***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com