当前位置:主页 > 科技论文 > 软件论文 >

基于邻域三支决策的不平衡数据二分类方法及其应用研究

发布时间:2024-01-31 19:30
  不平衡数据是指具有类间分布不平衡特点的数据,用基于数据类间分布均衡的经典分类算法处理这类数据,会导致算法对少数类数据的学习率不足,分类表现较差。重采样可以改变数据类间分布,降低数据的不平衡度,解决不平衡数据问题。然而多数重采样方法缺乏对数据空间的评估,以致与原有的数据空间分布差异过大,影响算法的分类性能,使泛化能力变弱。利用可适当衡量样本空间的邻域模型与可解决复杂问题框架的三支决策理论进行重采样,可以有指导性地降低数据的不平衡度,解决不平衡数据的二分类问题。因此,结合邻域模型及三支决策理论,本文对不平衡数据的二分类问题进行研究,其主要工作如下:(1)针对不平衡数据的二分类问题,结合邻域模型和三支决策理论,提出了基于邻域三支决策的不平衡数据的二分类方法(NT-IDBC)。首先,根据邻域模型以及三支决策理论,定义用于数据空间划分的相关公式及参数;其次,根据决策函数划分数据的区域空间,对多数类数据与少数类数据类间分布相对均衡的空间采用有选择的过采样方法处理,并对多数类数据分布较密集的空间采用过采样与欠采样结合的混合采样方法处理;最后,采用若干UCI数据库中的不平衡数据集,在F-value和A...

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

图3.1正域空间的划分示例

图3.1正域空间的划分示例

01111(())1#jimnx类数据和少数类数据平均密着0m1((())1)/(1))#jjxm增大多,x属于负域空间的可能性))/(1))n越大时,f(x)越大,说的可能性较高。同时为了避免法处理。文将给出简单的数据空间划分


图3.2边界域空间的划分示例

图3.2边界域空间的划分示例

第3章基于邻域三支决数类数据,减号表示少数类数((x))=2,若1n1()#iix=x)>,x1被划分至正域空间


图3.3负域空间的划分示例

图3.3负域空间的划分示例

x1被划分至正域空间图3.2边界域空间的划分示例数类数据,减号表示少数类数=3,若=1.2,x1被划分至边界域空间。


图3.4边界域空间过采样的基本原理图

图3.4边界域空间过采样的基本原理图

图3.4边界域空间过采样的基本原理图3.4给出了边界域空间中少数类数据的过采样基本原理。其中,实线示边界域空间,实线圆外部表示负域空间。以少数类数据S1为例,。先搜索距离S1最近的N(N=5)个少数类数据(S2、S3、S4、S5和S6),的少数类数据(N1、N2、....



本文编号:3891424

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3891424.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户3470d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com