当前位置:主页 > 医学论文 > 生物医学论文 >

基于二代测序的目标区段SNP识别数据流的建立与比较分析

发布时间:2017-07-07 05:05

  本文关键词:基于二代测序的目标区段SNP识别数据流的建立与比较分析


  更多相关文章: 临床诊断 Ion二代测序技术 BSFI 比对 SNP分型


【摘要】:随着测序技术的不断革新,高通量测序技术在个体化诊疗中的需求日益高涨。结合高通量测序,通过对基因组测序数据的分析,来明确病人DNA信息,并帮助医生对疾病的诊断治疗已经成为当前的一个医疗趋势。目前,该领域存在的主要问题是现有的生物信息学分析流程仍然不能很好的满足当前大数据的分析需求。作者所在实习单位开发了基于二代测序平台的SNP鉴定技术,其所带来的个体化数据解决方案亟待开发。本研究针对该测序方案建立了目标区段SNP识别数据流,主要包括测序数据的质控,测序数据接头引物的去除,样本的筛选与分类,barcode的切除,序列的比对,参考序列SNP位点处的突变鉴定,样本基因型的判断。在得到原始测序数据后,通过这套数据处理流程可以快速而准确的获得样本SNP分型信息。在本工作流程中,先使用Cutadapt软件以Q20指标进行reads质量过滤与引物接头剪切,能够去约四分之一质量较差的数据;然后使用Fastx或BSFI软件进行样本分类,可归集到约64%的reads数;待样本分类完成之后,借助连在barcode上接头序列使用Cutadapt将这些片段连同barcode一并切除;再通过自己编写脚本从筛选好的数据中挑出不同项目的样本数据,并将这些数据比对到项目对应的参考序列上,比对所选用软件是BWA,在分类好的样本序列中,超过90%的reads可以比对到参考基因上,随后从比对结果中使用Samtools软件鉴定SNP信息。在鉴定SNP信息之后,获得了包含样本比对结果的mpileup文件,再通过编写脚本对mpileup文件中的数据进行简化归类并对分型结果进行判定,并将判定结果以更加简洁的文本形式输出。由于在样本分类过程中使用Fastx所耗计算时间过多,因此在流程优化时,重点编写了全新的BSFI程序。在该程序中的barcode筛选中额外加入了允许一个碱基的缺失(Deletion),并采用了多线程来加快数据的筛选速度。与Fastx相比,在不损失准确度的情况下,BSFI的样本分类速度显著提升,大约缩短至原先的六分之一,使得整体SNP数据流能在一个工作日能完成。本研究开发的基于二代测序数据的SNP识别数据流,从数据获取到数据产生仅需6小时,能够满足基于二代测序平台的SNP鉴定技术所带来的个体化数据需求。
【关键词】:临床诊断 Ion二代测序技术 BSFI 比对 SNP分型
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R440;Q811.4
【目录】:
  • 摘要5-7
  • ABSTRACT7-10
  • 第一章 绪论10-21
  • 1.1 研究背景10-14
  • 1.2 部分二代测序数据分析软件的简介14-19
  • 1.3 研究目的与意义19-21
  • 第二章 数据结构与流程的初步实现21-46
  • 2.1 数据信息的简介21-33
  • 2.2 处理流程的建立33-35
  • 2.3 流程的初步实现35-46
  • 第三章 整个流程的数据结果46-68
  • 3.1 测序数据的质控结果46-51
  • 3.2 样本barcdoe的筛选结果51-52
  • 3.3 Alignment(比对)及SNP calling的结果52-68
  • 第四章 流程优化68-85
  • 4.1 样本筛选分类优化68-84
  • 4.2 序列切除软件的比较84-85
  • 总结与展望85-87
  • 参考文献87-91
  • 致谢91

【参考文献】

中国期刊全文数据库 前5条

1 周晓龙;葛星;时巧梅;徐丽芳;徐莉春;;候选基因SNP位点与非综合征性唇腭裂的相关性[J];江苏预防医学;2016年01期

2 陈兴健;徐百成;陈迟;朱一鸣;刘晓雯;杨小龙;王艳莉;边盼盼;郭玉芬;;SNPscan法用于新疆主要少数民族非综合征型聋患者GJB2基因突变筛查的研究[J];听力学及言语疾病杂志;2014年06期

3 唐立群;肖层林;王伟平;;SNP分子标记的研究及其应用进展[J];中国农学通报;2012年12期

4 黄代新;桂程;易少华;杨庆恩;杨荣芝;梅q;;Typing of 24 mtDNA SNPs in a Chinese Population Using SNaPshot Minisequencing[J];Journal of Huazhong University of Science and Technology(Medical Sciences);2010年03期

5 张素华;李莉;李成涛;赵书民;;TaqMan探针技术用于X-SNP位点的分型[J];法医学杂志;2010年01期



本文编号:528900

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/528900.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eda47***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com