针对图像分类的对抗样本防御方法研究

发布时间:2022-08-02 19:03
  近年来,深度神经网络在各个领域中都实现了先进的性能,如图像分类、人脸识别、目标检测等。然而最近的研究表明,深度神经网络容易受到对抗样本的攻击。向原始图像中加入精心设计的微小扰动,可以使深度神经网络输出错误的结果,这导致深度神经网络的安全性与可靠性受到严重的质疑。为此,如何减轻对抗样本的威胁,提高深度神经网络的对抗鲁棒性已成为迫切需要解决的问题。在深入研究现有对抗防御方法的基础上,该文提出了三种新的防御方法,以使得深度神经网络在图像分类领域中具有更好的对抗鲁棒性,主要的研究工作与创新点如下:1)提出基于自适应噪声添加的对抗防御方法:以往利用噪声添加的防御方法在训练防御模型时向原始图像中添加均匀噪声,没有考虑到神经网络对图像中不同区域的敏感性不同。为此,通过实验分析了梯度与添加噪声大小的关系,提出利用梯度指导噪声添加的方式来训练神经网络,该方法在训练深度神经网络时向图像中敏感性不同的区域添加不同大小的高斯噪声。对于敏感性较大的区域添加较大的噪声,以抑制神经网络对输入变化的敏感性,在敏感性较小的区域添加较小的噪声,以提高神经网络的分类准确率。实验结果表明:该方法提高了深度神经网络的对抗鲁棒性... 

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 深度学习的发展
        1.2.2 对抗攻击方法研究现状
        1.2.3 对抗防御方法研究现状
    1.3 论文研究主要内容
    1.4 论文组织结构
2 相关技术概述
    2.1 对抗学习的相关概念
    2.2 白盒对抗攻击算法
        2.2.1 FGSM方法
        2.2.2 I-FGSM方法
        2.2.3 PGD方法
        2.2.4 MT-PGD方法
        2.2.5 ODI-PGD方法
    2.3 黑盒对抗攻击方法
        2.3.1 MI-FGSM方法
        2.3.2 DI~2-FGSM方法
        2.3.3 TI-FGSM方法
    2.4 对抗防御方法
        2.4.1 基于输入转换的防御方法
        2.4.2 基于鲁棒优化的防御方法
    2.5 本章小结
3 基于自适应噪声添加的对抗防御方法
    3.1 引言
    3.2 梯度指导噪声添加的训练算法
        3.2.1 梯度与添加噪声的关系分析
        3.2.2 算法理论分析
        3.2.3 算法时间复杂度分析
        3.2.4 算法描述
    3.3 实验结果及分析
        3.3.1 实验设置
        3.3.2 GGNA方法和添加普通高斯噪声方法的不同
        3.3.3 GGNA方法训练时添加噪声标准差对准确率的影响
        3.3.4 GGNA方法和普通对抗训练方法训练时间的对比
        3.3.5 不同防御方法的准确率比较
        3.3.6 不同攻击方法下对抗样本准确率的比较
    3.4 本章小结
4 基于多样性初始化对抗训练的防御方法
    4.1 引言
    4.2 经验性分析
        4.2.1 从输入空间的角度分析
        4.2.2 从输出空间的角度分析
    4.3 提出方法
        4.3.1 热重启方法
        4.3.2 最小化正确类输出多样性初始化方法
        4.3.3 高效热重启的投影梯度下降方法
    4.4 对抗攻击的实验结果与分析
        4.4.1 实验设置
        4.4.2 相同重启次数下和现有的攻击方法的比较
        4.4.3 相同准确率时,各攻击方法重启次数的比较
    4.5 消融实验
        4.5.1 实验设置
        4.5.2 MCC-ODI 方法与ODI 方法的比较
        4.5.3 热重启方法和冷重启方法的比较
    4.6 基于多样性初始化对抗训练的防御方法
        4.6.1 算法描述
        4.6.2 实验设置
        4.6.3 多样性初始化对抗训练的防御性能
    4.7 本章小结
5 基于多模型集成的对抗样本防御方法
    5.1 引言
    5.2 多模型集成的对抗防御方法
    5.3 实验结果及分析
        5.3.1 实验设置
        5.3.2 对单个模型攻击时集成模型和单个模型的性能比较
        5.3.3 对集成模型及单个模型攻击时集成模型和单个模型的性能比较
    5.4 本章小结
6 总结与展望
    6.1 本文工作总结
    6.2 未来工作展望
致谢
参考文献
个人简历、在学期间发表的学术论文及取得的研究成果



本文编号:3669073

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3669073.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ebe9e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com