基于机器学习的基因癌症诊断方法研究
本文关键词:基于机器学习的基因癌症诊断方法研究
更多相关文章: 基因芯片 遗传算法 支持向量机 二进制量子行为粒子群算法
【摘要】:目前,联合生命科学与信息科学的基因芯片技术已经成为人类探索生物分子信息的有效方法之一,同时也成为生物信息学中最为广泛使用的技术之一。通过基因芯片技术可以同时测定某一细胞中成千上万个基因的表达情况。基因芯片技术为基因诊断和辅助疾病治疗等应用提供了有效前提和技术保障。随着基因芯片技术的极快发展,利用基因微阵列表达谱辅助癌症诊断吸引了越来越多的科研人员的关注。基因微阵列数据有别于一般的分类数据,与其高维特性相比,样本量就显得太过缺少。这使得研究重点集中在对高维数据的降维和利用少量样本进行训练和分类,以选出真正具有分类信息的基因,得到较高的分类正确率。针对这一研究课题,本文首先提出了基于改进的遗传算法的癌症特征基因选择与分类方法。在改进的遗传算法中,交叉操作使用均匀交叉策略,变异操作使用变异概率非线性变化策略,同时根据最优特征基因子集的特点增加最优个体变异策略。均匀交叉策略增强了遗传算法的全局搜索性能。到了遗传算法的迭代后期,当个体聚集到最优解附近时,变异概率增大有效的增强了遗传算法的局部搜索能力,避免了遗传算法的早熟收敛。最优个体变异策略有效利用了每次迭代找到的全局最优解,更增加了遗传算法寻找到最优解的可能。实验结果表明,改进的遗传算法明显比基本遗传算法具有更强的分类性能,而且具有更好的鲁棒性。本文将二进制量子行为粒子群算法引入到癌症特征基因选择过程中,提出基于二进制量子行为粒子群优化算法的癌症特征基因选择与分类方法。二进制量子行为粒子群优化算法是量子行为粒子群优化算法在二进制空间的版本,是群体智能算法中的一种。将其作为特征空间中的搜索引擎,与支持向量机相结合,在原始的特征空间中选择出了具有较强分类性能的特征基因子集。实验结果表明,与粒子群算法和遗传算法作为搜索引擎相比,二进制量子行为粒子群算法具有更强的搜索能力,且具有更好的鲁棒性。得到的特征基因子集规模更小,对癌症数据集的分类精度更高。本文在分析了二进制量子行为粒子群算法的收敛过程之后,为了能够有效地避免算法在寻找最优特征基因子集的过程中陷入早熟收敛,在算法中加入了可变种群规模机制,以使得算法在出现早熟时能够有效地跳出局部搜索区域,增强算法的全局搜索性能。实验结果表明,可变种群规模的二进制量子行为粒子群算法相比于原算法具有更强的搜索性能,在迭代后期能够找到更好的基因子集,有效避免了算法陷入早熟收敛。
【关键词】:基因芯片 遗传算法 支持向量机 二进制量子行为粒子群算法
【学位授予单位】:江南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R730.4;TP18
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-13
- 1.1 研究背景和意义8-9
- 1.2 国内外研究现状9-10
- 1.3 本文研究内容10-11
- 1.4 本文组织结构11
- 1.5 本章小结11-13
- 第二章 特征基因选择相关理论与群体智能算法13-21
- 2.1 基因芯片技术概述13-14
- 2.1.1 基因芯片技术的基本原理13
- 2.1.2 基因芯片技术的特点13
- 2.1.3 基因芯片的应用13-14
- 2.2 特征选择概述14-15
- 2.2.1 特征选择的意义14
- 2.2.2 特征选择算法14-15
- 2.3 智能算法15-17
- 2.3.1 智能算法概述15-16
- 2.3.2 群体智能算法16-17
- 2.4 支持向量机17-19
- 2.4.1 数据分类技术17-18
- 2.4.2 支持向量机理论18-19
- 2.4.3 LIBSVM工具箱19
- 2.5 癌症数据集19-20
- 2.6 本章小结20-21
- 第三章 基于改进的遗传算法的癌症特征基因选择与分类21-36
- 3.1 遗传算法21-23
- 3.1.1 基本原理21-22
- 3.1.2 编码22
- 3.1.3 选择操作22
- 3.1.4 交叉操作22-23
- 3.1.5 变异操作23
- 3.2 改进的遗传算法23-25
- 3.2.1 均匀交叉策略23-24
- 3.2.2 变异概率非线性变化策略24-25
- 3.2.3 最优个体变异策略25
- 3.3 基于改进的GA/SVM的癌症特征基因选择与分类25-26
- 3.4 适应值函数26-27
- 3.5 实验环境设置27
- 3.6 实验结果分析27-35
- 3.6.1 算法性能分析27-30
- 3.6.2 鲁棒性分析30-31
- 3.6.3 生物意义分析31-35
- 3.7 本章总结35-36
- 第四章 基于BQPSO算法的癌症特征基因选择与分类36-49
- 4.1 粒子群算法36-37
- 4.2 量子行为粒子群算法37-38
- 4.3 二进制编码的量子行为粒子群算法38-40
- 4.4 基于BQPSO/SVM算法的癌症特征基因选择与分类40-41
- 4.5 BQPSO/SVM,PSO/SVM,GA/SVM对比实验设置41-42
- 4.6 实验结果分析42-48
- 4.6.1 算法性能分析42-43
- 4.6.2 算法鲁棒性分析43-44
- 4.6.3 生物意义分析44-48
- 4.7 本章小结48-49
- 第五章 基于VP-BQPSO算法的癌症特征基因选择与分类49-59
- 5.1 BQPSO算法早熟收敛分析49
- 5.2 VP-BQPSO算法49-51
- 5.3 基于VP-BQPSO/SVM的癌症特征基因的选择与分类51
- 5.4 实验结果分析51-58
- 5.4.1 算法性能比较51-54
- 5.4.2 生物意义分析54-58
- 5.5 本章小结58-59
- 主要结论与展望59-61
- 致谢61-62
- 参考文献62-65
- 附录: 作者在攻读硕士学位期间发表的论文65
【参考文献】
中国期刊全文数据库 前10条
1 刘秀珍;张如意;栾海云;李淑翠;;基因芯片技术及应用[J];滨州医学院学报;2007年01期
2 周江菊;人类基因组计划[J];常德师范学院学报(自然科学版);2001年01期
3 丁世飞;齐丙娟;谭红艳;;支持向量机理论与算法研究综述[J];电子科技大学学报;2011年01期
4 余达太;马欣;;一种人工神经网络算法在燃料电池中的应用[J];电力电子技术;2008年10期
5 李颖新,刘全金,阮晓钢;一种肿瘤基因表达数据的知识提取方法[J];电子学报;2004年09期
6 ;Gene Expression Data Classification Using Consensus Independent Component Analysis[J];Genomics Proteomics & Bioinformatics;2008年02期
7 蔡君;王宇;;基于有监督学习的应用识别研究[J];广东技术师范学院学报;2013年07期
8 王辉;钱锋;;群体智能优化算法[J];化工自动化及仪表;2007年05期
9 周晓光;任鲁风;李运涛;张猛;俞育德;于军;;下一代测序技术:技术回顾与展望[J];中国科学:生命科学;2010年01期
10 黄解军,潘和平,万幼川;数据挖掘技术的应用研究[J];计算机工程与应用;2003年02期
中国博士学位论文全文数据库 前1条
1 宫秀军;贝叶斯学习理论及其应用研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前1条
1 崔珊珊;遗传算法的一些改进及其应用[D];中国科学技术大学;2010年
,本文编号:561548
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/561548.html