当前位置:主页 > 科技论文 > 基因论文 >

基于多元学生t分布的基因网络扰动分析方法研究

发布时间:2024-04-10 03:32
  推断不同生物学条件下的基因网络扰动对于理解复杂疾病的机制有着很重要的作用。通常,我们使用假设数据服从多元正态分布的高斯图模型建模,来推断基因网络的扰动。但是,由于数据会受到极端异常值的影响,因此这个假设通常不符合实际情况。本文基于多元学生t分布,提出了一个更鲁棒的差异图模型来推断不同条件下的基因网络扰动。因为多元t分布有着重尾的性质,所以它比正态分布对异常值的鲁棒性更强。同时,我们利用fused lasso惩罚来考虑不同条件之间网络的相似性。本文利用期望极大化算法来求解这个优化模型。模拟实验的结果表明,我们的方法优于对比的方法。将本文提出的方法应用于乳腺癌的不同亚型和胶质母细胞瘤的不同亚型中,推断不同亚型之间的基因网络扰动,发现了几个驱动基因网络扰动的关键基因。

【文章页数】:43 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 引言
    1.1 研究背景
    1.2 研究现状
    1.3 本文的主要工作和创新点
    1.4 本文的组织结构
第二章 预备知识
    2.1 高斯图模型
    2.2 多元t分布
    2.3 极大似然估计
    2.4 期望极大化算法
        2.4.1 隐变量
        2.4.2 期望极大化算法主要思想及步骤
第三章 模型的建立与求解
    3.1 模型的提出
    3.2 算法
    3.3 调优参数的选择
第四章 实验
    4.1 模拟实验
        4.1.1 数据的生成
        4.1.2 模拟实验结果分析
    4.2 真实数据分析
        4.2.1 对乳腺癌数据的分析
        4.2.2 对胶质母细胞瘤数据的分析
第五章 总结与展望
参考文献
致谢



本文编号:3950079

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3950079.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户6646f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]