基于GAN的不平衡数据增强算法及其应用研究

发布时间：2024-04-13 05:26

　　随着机器学习和数据挖掘的快速发展,越来越多的研究通过学习挖掘海量数据中的规律和特征,来实现更加准确的预测和推断。对海量数据进行自动分类能够大大的提高人们获取信息的效率。传统的分类方法是建立在类分布大致平衡的假设基础上,然而,现实生活中的很多数据都是不平衡的,例如癌症检测、网络攻击识别等,因此,不平衡数据增强算法的研究课题,近两年来受到越来越多的关注。现有的解决不平衡数据分类问题的主流方法有采样和集成学习相结合的方法,例如SMOTEBoost、RUSBoost、EUSBoost等算法。以上算法在初始化时给每个样本赋予相同的权重,然后分别训练分类器,根据误差率的反馈不断地调整样本的权重,最后得到表现较好的分类器。这些算法在某些特定情况下会过度依赖原始数据集。针对上述问题,本文中提出了用生成式对抗网络进行数据增强以解决不平衡数据分类的问题。本文主要贡献如下:(1)针对训练数据集样本不足的情况,提出了基于GAN的不平衡数据增强算法,利用该算法生成图像组成新的数据集,然后提取图像特征并分类,实验证明,生成的图像在样本多样性上有较好的效果,并且通过该方法进行数据增强后,数据的分类结果有了较好的提升...

【文章页数】：75 页

【学位级别】：硕士

【文章目录】：
致谢
摘要
ABSTRACT
1 引言
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 数据层面解决策略
        1.2.2 算法层面解决策略
        1.2.3 综合解决策略
    1.3 主要工作和研究内容
    1.4 组织结构
2 相关理论介绍
    2.1 数据不平衡
        2.1.1 数据不平衡介绍
        2.1.2 常见形式和特点
        2.1.3 解决办法
    2.2 生成式对抗网络
        2.2.1 核心思想
        2.2.2 实现过程
        2.2.3 网络特点
    2.3 本章小结
3 基于DCGAN的不平衡数据增强算法
    3.1 问题提出
    3.2 算法流程
    3.3 算法训练
        3.3.1 深度卷积生成式对抗网络的训练
        3.3.2 VGG16的训练
        3.3.3 基础分类器训练
    3.4 实验分析
        3.4.1 数据集描述
        3.4.2 实验设计
        3.4.3 结果分析
    3.5 本章小结
4 基于DCGAN的集成学习的不平衡数据增强算法
    4.1 问题提出
    4.2 算法描述
        4.2.1 算法介绍
        4.2.2 算法流程
    4.3 实验分析
        4.3.1 数据集描述
        4.3.2 实验设置
        4.3.3 实验准备
        4.3.4 结果分析
    4.4 算法实验结果对比
    4.5 本章小结
5 不平衡数据增强算法的应用系统设计与实现
    5.1 系统功能介绍
    5.2 系统设计介绍
    5.3 部分界面
    5.4 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集

本文编号：3952549

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3952549.html

上一篇：数据驱动带单位生产数量约束的星际争霸建造顺序最优化
下一篇：基于模因理论视角的抖音短视频APP的内容分析