基于高维小样本数据和类别不平衡数据的反距离加权支持向量机

发布时间：2023-04-19 05:00

　　分类的目的在于根据其特征将数据“分门别类”,在数据挖掘中的研究中备受人们的关注。分类问题包含了两个基本过程:学习和分类。在学习的过程中,利用有效的学习方法,从已知类别的训练数据集中学习一个分类器;在分类的过程中,使用学习得到的分类器,对类别未知的数据进行分类。由此可见,分类的准确程度依赖于分类器的准确性,所以分类的重点在于分类器的学习。支持向量机(SVM)和距离加权判别(DWD)是两个非常常用的分类算法,其搜索最佳分离超平面的策略均是使得间隔最大化。在SVM中,只有支持向量才会对分离超平面的学习有影响,所以对类别不平衡数据不敏感。但是,在损失最小化的过程中,SVM容易出现高维小样本数据下的“数据堆积”现象,即在分离超平面两侧的间隔边界上堆积了很多样本点(即支持向量),造成过度拟合。在DWD中,所有样本点都对分离超平面的学习有不同程度的影响,所以可以有效地解决高维小样本数据的过拟合问题。但是,面对类别不平衡数据时,DWD为了减少整体误分类,容易偏向于多数类,从而将分离超平面推向少数类一侧。灵活分类器(FLAME)和距离加权支持向量机(DWSVM)的提出,就是为了解决上述提到的高维小样本数...

【文章页数】：63 页

【学位级别】：硕士

【文章目录】：
摘要
ABSTRACT
第一章绪论
    1.1 研究背景与意义
    1.2 研究现状
    1.3 本文的主要贡献
    1.4 本文的研究内容与结构安排
第二章数据挖掘概述
    2.1 数据库中的知识发现
    2.2 数据挖掘
    2.3 数据挖掘的方法(任务)
    2.4 数据挖掘的技术
第三章一些经典的分类算法
    3.1 分类和损失函数
    3.2 支持向量机(SVM)
    3.3 距离加权判别(DWD)
    3.4 模糊支持向量机(FSVM)
第四章高维小样本数据和类别不平衡数据的分类问题
    4.1 高维小样本数据的过拟合问题
    4.2 类别不平衡数据的敏感问题
    4.3 灵活分类器(FLAME)
    4.4 距离加权支持向量机(DWSVM)
第五章基于高维小样本数据和类别不平衡数据分类的新算法
    5.1 反距离加权支持向量机(IDWSVM)
    5.2 松弛变量及惩罚参数的分析
第六章实例分析
    6.1 高维小样本数据
    6.2 类别不平衡数据
第七章总结与展望
    7.1 总结
    7.2 展望
参考文献
致谢
学位论文评阅及答辩情况表

本文编号：3793765

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3793765.html

上一篇：杜绝数据造假:誊清见底、挤干水分
下一篇：利用移动通信大数据进行人口动态监测的数据价值

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|