当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于内存计算的基因疾病搜索系统

发布时间:2024-03-10 13:42
  随着现代测序技术的发展,产生海量生物数据,快速发展的生物信息学也在不断剖析这些数据的隐藏生物信息。通过生物网络研究基因型与疾病表型的关联关系从而实现致病基因的预测和寻找基因导致的疾病。基于疾病基因模块性特征,提出整合蛋白质相互作用网络、疾病表型相似性网络、疾病-基因对应网络,构建异构生物网络,改进网页排序算法TrustRank,对候选基因与疾病进行优先级排序,实现预测功能。本文还将通过Spark平台开发基因疾病搜索系统,数据存储在HBase中,形成大数据存储、处理、分析的解决方案,对临床诊断和疾病治疗提供新思路。

【文章页数】:5 页

【部分图文】:

图1整合后的异构网络Fig.1Integratedheterogeneousnetwork"!"""*")

图1整合后的异构网络Fig.1Integratedheterogeneousnetwork"!"""*")

后的转移概率满足:MDG=p(gi|dj)=Ai,j/∑jAi,j(3)同理,从基因到疾病的转移矩阵MGD满足:MGD=p(dj|gi)=Aj,i/∑iAj,i(4)首先构建生物信息的异构网络表明来自多个公共资源的先验信息,表示成G=(V,E),其中V表示节点集合,E表示边集合,....


图5系统首页

图5系统首页

大数据框架是Sparkonyarn平台,主要选用技术包括MongoDB数据库存储和SparkSQL查询,输出的是与输入相关的基因型或者表型。设计课题提供一个可扩展且高性能的存储、处理、分析基因大数据的解决方案,设计构建框架如图4所示。!!!!!!!!!!""#$$%$&’()*+....


图6搜索结果页面Fig.6Searchresultspage

图6搜索结果页面Fig.6Searchresultspage

大数据框架是Sparkonyarn平台,主要选用技术包括MongoDB数据库存储和SparkSQL查询,输出的是与输入相关的基因型或者表型。设计课题提供一个可扩展且高性能的存储、处理、分析基因大数据的解决方案,设计构建框架如图4所示。!!!!!!!!!!""#$$%$&’()*+....


图7链接HPRD页面Fig.7LinktheHPRDpage

图7链接HPRD页面Fig.7LinktheHPRDpage

图7链接HPRD页面Fig.7LinktheHPRDpage4结束语使用计算方法预测候选基因-疾病相关性既可以研究发病机理,而且也有助于疾病诊断、治疗,以及预防。近年来随着精准医疗的提出与广受关注,个人医疗数据正日趋丰富,通过大数据技术来展开处理研究已成为未来的热点领域。同时个人....



本文编号:3924881

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3924881.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户d354d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com