当前位置:主页 > 理工论文 > 生物学论文 >

数据驱动的蛋白质互作用网络中复合体检测算法研究

发布时间:2020-04-20 16:51
【摘要】:作为生物信息学的研究热点之一,蛋白质相互作用网络中的复合体检测不仅对于关系数据分析、网络结构特征分析、生命活动探索等问题具有重要的科学研究意义,同时在蛋白质功能注释、疾病分析和药物设计等领域发挥着重要的应用价值.蛋白质相互作用网络中的复合体检测计算方法研究中,已有研究成果更多地从方法层面进行子图挖掘工作.随着复杂网络特征分析的发展和复合体特点的深入了解,蛋白质相互作用网络的小世界、无标度等复杂拓扑特征以及蛋白质复合体重叠性、小规模等特点,对蛋白质复合体检测算法提出了更多的挑战和要求,有待更加深入的研究.本文以数据为驱动来开展蛋白质相互作用网络中的复合体检测问题的研究.以数据为基础,针对蛋白质相互作用网络特征以及复合体特点,从不同的角度研究有效检测蛋白质复合体的算法,主要工作如下:(1)针对蛋白质复合体所具有的重叠性和小规模特点,提出了基于流模拟的复合体检测算法.该算法以网络流理论为基础,基于结点直接邻域信息给出了基于结构等价性的边容量和结点重要性度量方法,进而给出了流动源点的选择方法;从网络局部连边关系出发模拟了网络中的流动过程,使网络连通区域均能够获得来自不同源点的流量信息;参考信息传播中的线性阈值模型,设计了簇的判定条件.实验结果表明,该算法能够同时发现重叠簇和小规模簇,能够有效地进行蛋白质复合体检测,为流模拟思想在复合体检测算法设计中的实现提供了新的思路.(2)针对复合体的重叠特性,以及蛋白质相互作用网络中用于描述连边趋势的同配性特征,提出了基于网络同配性的复合体检测算法.该算法将结点重要性度量推广到结点的二阶邻域;通过引入网络同配性,实现了聚类过程中的多候选结点添加;为了评估重叠复合体预测结果的准确性,提出了一种簇之间重叠关系准确率评价指标.该算法建立了网络特征分析与网络模块发掘之间的联系.实验结果表明,基于网络同配性设计的复合体检测算法能够有效地进行重叠复合体检测.(3)针对复合体呈现出的中心稠密外围稀疏的结构特点,利用蛋白质相互作用网络中丰富的局部结构信息,提出了多信息融合的种子扩展复合体检测算法.该算法利用线性组合模型将多个网络结构信息进行加权融合,进而将结点重要性度量推广到结点的k-阶邻域子图;将概率模型用于种子选择,提高结构信息的有效利用,实现算法多样性;综合利用簇内密度与外围连边密度信息来刻画复合体中心稠密外围稀疏的结构特点.实验结果表明,新的种子扩展算法具有很好的复合体预测性能.(4)针对蛋白质相互作用网络所具有的小世界、无标度、聚集性等网络特征,提出了基于多网络特征的复合体检测算法.该算法通过相关性分析将网络特征引入到k-阶邻域子图内的结点重要性度量;结合无标度幂律分布和结点度信息,构建和分析了中心稠密外围稀疏的簇描述模型.多个网络特征信息的使用进一步增强了网络特征分析与网络模块发掘之间的联系.实验结果表明,所提出的算法能够很好地对蛋白质复合体进行检测.本文针对蛋白质相互作用网络特征以及复合体特点,结合复合体检测算法存在的缺陷与不足,提出了相应的复合体检测算法.研究工作既丰富了网络数据的分析方法,促进了计算机科学与生物学的结合与发展,又可以为关键蛋白质识别、功能注释、疾病分析等问题提供应用上的支持.
【学位授予单位】:山西大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:Q51;O157.5

【参考文献】

相关期刊论文 前4条

1 王杰;梁吉业;郑文萍;;一种面向蛋白质复合体检测的图聚类方法[J];计算机研究与发展;2015年08期

2 郭茂祖;代启国;徐立秋;刘晓燕;;一种蛋白质复合体模块度函数及其识别算法[J];计算机研究与发展;2014年10期

3 冀俊忠;刘志军;刘红欣;刘椿年;;蛋白质相互作用网络功能模块检测的研究综述[J];自动化学报;2014年04期

4 鱼亮;高琳;孙鹏岗;;蛋白质网络中复合体和功能模块预测算法研究[J];计算机学报;2011年07期



本文编号:2634738

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2634738.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f35a4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com