基于特征选择和集成学习的入侵检测方法研究

发布时间：2024-03-10 00:50

　　入侵检测是网络安全研究的热点领域,它是防范主机和网络攻击的一种有效措施。它的使用弥补了传统防火墙技术、签名认证技术和访问控制技术在安全防护上的不足。传统的入侵检测技术是通过人为构造的规则库来对数据进行甄别,其工作量繁杂而且检测率也不高。机器学习的出现为入侵检测提供了一种新的解决方案,入侵检测问题可通过机器学习中的分类问题来解决,通过使用入侵检测训练集来构建专门的分类模型,然后利用这个分类模型对新来的数据进行判断分类。但在入侵检测模型的构建中也存在着一些问题,入侵检测的训练集中不同类别的数据样本分布不平衡,以此建好的模型难以对少数类样本进行准确的分类。另外,入侵检测中数据的特征维度比较高,存在着冗余,影响模型分类的准确率和效率。所以针对这些问题,本文的主要研究内容如下:(1)对入侵检测基准数据集KDDcup99进行了去除冗余数据的处理,大幅减小了数据的规模,缩短了不同类别间样本的数量差距。然后在此基础上,对样本中每个特征的取值做了详细的统计分析,找出那些取固定值比例超过99.9%的特征,并对它们剩余的0.01%的取值在不同类别间的分布进行具体分析,找出影响度较小的那些特征,在模型构建前剔...

【文章页数】：71 页

【学位级别】：硕士

【文章目录】：
摘要
Abstract
1 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 入侵检测简介
        1.2.2 入侵检测中基础分类器的选用
        1.2.3 入侵检测中特征的处理与研究
    1.3 主要研究内容
    1.4 论文组织结构
2 相关基础工作与准备
    2.1 机器学习基础分类算法
        2.1.1 K近邻算法
        2.1.2 支持向量机
        2.1.3 决策树
    2.2 入侵检测数据集
        2.2.1 KDDcup99 数据集描述
        2.2.2 KDDcup99 数据集数据的统计分析
    2.3 数据集的预处理
        2.3.1 去除冗余数据
        2.3.2 数值特征转换与归一化
    2.4 本章实验
        2.4.1 评价指标
        2.4.2 超参数的网格搜索
        2.4.3 去冗余与特征删除前后实验对比
    2.5 本章小结
3 基于互信息和萤火虫算法的入侵检测方法研究
    3.1 基于互信息的特征选择
        3.1.1 互信息与熵
        3.1.2 最大化互信息进行特征选择
    3.2 基于萤火虫算法的特征选择
        3.2.1 基础萤火虫算法
        3.2.2 改进的萤火虫算法用于特征特征选择
        3.2.3 特征选择最终决策
    3.3 本章实验
        3.3.1 不平衡数据的采样
        3.3.2 实验分析
    3.4 本章小结
4 基于集成学习的入侵检测方法研究
    4.1 集成学习的相关构成
        4.1.1 集成学习的多样性
        4.1.2 集成学习的组合方式
        4.1.3 集成学习的结果整合策略
    4.2 基于集成方法解决数据不平衡问题
        4.2.1 基于Bagging的方法解决数据不平衡问题
        4.2.2 基于Stacking的方法解决数据不平衡问题
    4.3 本章实验
    4.4 本章小结
5 总结与展望
    5.1 本文工作总结
    5.2 未来工作方向
参考文献
攻读硕士学位期间发表论文及科研成果
致谢

本文编号：3924012

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/ydhl/3924012.html

上一篇：一种在云基础架构中识别基于网络的攻击的新方法研究
下一篇：军事网络APT攻击防御体系设计

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|