当前位置:主页 > 科技论文 > 软件论文 >

多组学数据融合的驱动基因识别方法研究

发布时间:2024-03-03 10:00
  癌症是一种复杂的疾病,对人类生命构成严重威胁。高通量测序技术的突破降低了癌症诊断、临床治疗和预后预测等方面的研究成本。整合多组学高通量数据,让癌症研究系统且全面的分析成为了可能,癌症生成过程也得到了更深层次和更完整的研究。从遗传学的角度分析,癌症的产生是基因突变不断选择、累积的结果。因此,通过整合多组学数据挖掘与癌症相关的基因和驱动癌症的基因,成为研究癌症致病机制的热点。本文提出了两种识别驱动基因的方法,主要工作包括以下两点:(1)提出一种基于重叠社区发现的驱动基因方法(GCommunity),用来挖掘具有重叠性质的基因社区并识别与癌症相关的驱动基因。该方法首先采用EMDomics对具有高异质性的癌症数据进行差异表达分析,筛选出显著差异表达的基因作为输入基因;然后对基因表达数据进行吉布斯采样聚类(Gibbs sampler)构建基因相互作用网络,并加入蛋白质相互作用(PPI)数据,使得基因相互作用网络的信息更加完善;通过重叠社区发现的算法挖掘最终的基因社区;通过对拷贝数变异数进行频率计算选出癌症的候选驱动基因,再利用回归树模型建立候选驱动基因和基因社区之间的调控机制,从而获得最终的癌症...

【文章页数】:67 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景及研究意义
    1.2 国内外研究现状
    1.3 主要研究内容与结构安排
第2章 相关理论基础
    2.1 高通量数据介绍
        2.1.1 基因表达数据
        2.1.2 拷贝数变异数据
        2.1.3 蛋白质相互作用数据
        2.1.4 体细胞突变数据
    2.2 关于数据整合的方法
        2.2.1 回归法
        2.2.2 矩阵分解法
        2.2.3 相关性分析法
    2.3 癌症驱动突变识别方法
        2.3.1 基于模块网络的驱动突变识别方法
        2.3.2 基于体细胞突变的驱动突变识别方法
    2.4 重叠社区发现方法
        2.4.1 团扩散法
        2.4.2 标签传播方法
        2.4.3 种子扩散方法
        2.4.4 算法性能总结
    2.5 本章小结
第3章 基于重叠社区发现的驱动基因识别方法
    3.1 基于重叠社区发现的驱动基因识别
        3.1.1 基因的差异表达分析
        3.1.2 构建基因相互作用网络
        3.1.3 重叠基因社区的识别
        3.1.4 候选调控基因的选择
        3.1.5 驱动基因识别
        3.1.6 方法小结
    3.2 实验与结果分析
        3.2.1 数据概述及预处理
        3.2.2 基因社区结果
        3.2.3 基因社区的生存分析
        3.2.4 基因社区的划分评估
        3.2.5 基因社区的功能分析
        3.2.6 驱动基因的识别
        3.2.7 驱动基因癌症预测分析
    3.3 本章小结
第4章 基于体细胞突变的癌症驱动基因识别方法
    4.1 基于体细胞突变的癌症驱动基因识别
        4.1.1 背景噪声处理
        4.1.2 突变分数的计算
        4.1.3 突变影响得分的计算
        4.1.4 驱动突变识别
    4.2 实验与结果分析
        4.2.1 实验数据及预处理
        4.2.2 驱动基因识别
        4.2.3 致癌基因和抑癌基因的识别
        4.2.4 驱动基因功能性分析
        4.2.5 癌症类型的共性分析
    4.3 本章小结
结论
参考文献
附录A 攻读硕士学位期间发表的论文和参加科研情况
致谢



本文编号:3917619

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3917619.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户84310***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com