当前位置:主页 > 科技论文 > 数学论文 >

基于多源生物学数据的蛋白质复合物与功能模块识别算法研究

发布时间:2024-06-29 03:18
  蛋白质复合物参与了细胞中大部分生物过程。生物过程涉及的蛋白质全体构成蛋白质功能模块,整体把握蛋白质功能模块对于阐明蛋白质功能性起到重要作用。通过计算方法分析蛋白质复合物和功能模块是获得细胞生命活动认识的重要途径。随着计算方法的不断发展,以及整合数据策略的不断创新,整合蛋白质组学数据集与模型框架、蛋白质复合物识别、动态复合物的分析以及功能模块的检测,有望促进蛋白质组学在医学领域的应用研究,为疾病诊断和靶点治疗提供更广阔的前景。早期的基于计算的蛋白质复合物与功能模块识别方法主要利用蛋白质相互作用网络(protein-protein interaction networks,PPI网络)的拓扑特征。随着生物学数据的丰富,研究者们开始融合其他的生物学信息,以更准确地识别出蛋白质复合物与功能模块。本文以蛋白质相互作用数据为基础,结合多源生物学数据,以蛋白质复合物、功能模块的本质特征为出发点,分析蛋白质复合物、功能模块的有关性质,研究提出新的蛋白质复合物与功能模块识别算法,主要研究成果如下:(1)基于蛋白质定位数据、基因表达数据、蛋白质基因本体标注和蛋白质交互可靠性得分的多源生物学数据,依据生命有...

【文章页数】:109 页

【学位级别】:博士

【部分图文】:

图3-1给定归一化两两共表达模式组的两种情形图3-1(a)显示3个表达模式f1(t)、f2(t)和f3(t)两两共表达,但由于f1(t)f2(t)f3(t)=0,所

图3-1给定归一化两两共表达模式组的两种情形图3-1(a)显示3个表达模式f1(t)、f2(t)和f3(t)两两共表达,但由于f1(t)f2(t)f3(t)=0,所

华南理工大学博士学位论文24皮尔森相关系数(Pearsoncorrelationcoefficient,pcc)可用于描述两个基因表达模式的相似度。设定两个基因表达模式x={x(t)|t=1,…,T}和y={y(t)|t=1,…,T},它们的相似度pcc(x,y)计算如下[112....


图3-2算法ICJointLE处理流程

图3-2算法ICJointLE处理流程

华南理工大学博士学位论文30算法ICJointLE基于核心-附件结构,采用种子扩展策略,从静态蛋白质交互作用网络中,识别出具有联合共定位、联合共表达特征的蛋白质复合物,其主要过程包括3个阶段:蛋白质核心挖掘、附件蛋白质添加和候选蛋白质复合物筛眩下面分别阐述算法ICJointLE各....


图3-3不同阈值r和colocalization参数不同设置时的#PM×FAM值

图3-3不同阈值r和colocalization参数不同设置时的#PM×FAM值

E识别复合物的过程。最后,将算法ICJointLE和其他已有的代表性算法进行实验性能对比分析。通过对测试的实验结果分析,我们发现一个蛋白质核心的r可靠密度随着核心蛋白质数增加而下降。于是,本文采用ρ=e-μc作为r可靠密度阈值,其中c是核心的蛋白质数,而密度衰减系数μ用于控制ρ随....


图3-5算法ICJointLE通过播种YOR281

图3-5算法ICJointLE通过播种YOR281

华南理工大学博士学位论文38stage1stage2PCNled(PC)PCN(PC)图3-5算法ICJointLE通过播种YOR281C识别仅含一个蛋白质的复合物的过程如图3-5所示,在步骤stage1,通过播种YOR281C,算法ICJointLE将蛋白质YOR281C添加进....



本文编号:3997085

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/3997085.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a7763***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com