当前位置:主页 > 理工论文 > 生物学论文 >

低覆盖基因组测序数据填充策略研究

发布时间:2022-02-14 18:49
  基因型填充技术,即利用现有的基因型信息,对未测定或者不完整的基因型进行计算推断,从而获得更多的基因组信息。其基本原理是根据参考群体或群体内其他个体与目标群体的基因型数据内的连锁不平衡信息和重组率等构建共有的单倍型片段,然后利用单倍型片段信息对目标群体内未分型位点进行估算并填充完整。基因型填充作为基因组数据处理的重要工具,填充结果的好坏直接影响后续分析,为了得到好的填充结果,需要制定完善的填充策略。本研究模拟出四个亲缘关系由远及近的群体共20000个个体、染色体长度为10Mb的基因组数据。将模拟后的数据按目标群体与参考群体划分并剔除MAF<0.01的位点。其中,填充验证(目标)群体固定为群体1内的1 000个个体,而参考群体大小为100、1 000、3 000、5 000、10 000个个体共五个水平。按芯片数据和全基因组测序数据两种数据类型对验证群体的位点进行删除,分别保留原位点数量的1、5、10、30、50、90%的位点,即目标群体位点占参考群体位点比例/SNP覆盖度。使用Beagle5.1和Minimac4两种软件进行填充,填充后计算填充可靠性、填充错误率和填充耗时。比较不同... 

【文章来源】:中国农业科学院北京市

【文章页数】:51 页

【学位级别】:硕士

【部分图文】:

低覆盖基因组测序数据填充策略研究


不同因素对填充可靠性的影响

错误率,因素,群体


中国农业科学院硕士学位论文第二章基因型填充策略研究16大小需要达到3000以上,且目标群体标记比例需达到10%;利用Minimac4填充时需要标记比例达到90%以上。注:三角形标志虚线代表Beagle5.1,圆形标志实线代表Minimac4。不同颜色的标志代表不同水平。Note:ThedottedlinewithatrianglesignrepresentsBeagle5.1,andthesolidlinewitharoundsignrepresentsMinimac4.Differentcoloredsignsrepresentdifferentlevels.图2-3.不同因素对填充错误率的影响(A)参考群体大小对填充错误率的影响;(B)目标群体位点比例对填充错误率的影响;(C)参考群体和目标群体间的遗传距离对填充错误率的影响。Fig.2-3Theinfluenceofdifferentfactorsonimputationerrorrate(A)theinfluenceofreferencepopulationsizeonimputationerrorrate;(B)theinfluenceoftargetpopulationsiteratioonimputationerrorrate;(C)theinfluenceofgeneticdistancebetweenreferencepopulationandtargetpopulationonimputationerrorrate.表2-6不同水平填充错误率统计信息Table2-6Thesummaryofimputationerrorrateatdifferentlevels填充软件参考群体大小目标群体标记比例/%1510305090Beagle5.110017.017.614.812.011.110.7100015.610.88.27.98.99.9

可靠性,因素,群体


中国农业科学院硕士学位论文第二章基因型填充策略研究19注:三角形标志虚线代表Beagle5.1,圆形标志实线代表Minimac4。不同颜色的标志代表不同水平。Note:ThedottedlinewithatrianglesignrepresentsBeagle5.1,andthesolidlinewitharoundsignrepresentsMinimac4.Differentcoloredsignsrepresentdifferentlevels.图2-4.不同因素对填充可靠性的影响(A)参考群体大小对填充可靠性的影响;(B)目标群体位点比例对填充可靠性的影响;(C)参考群体和目标群体间的遗传距离对填充可靠性的影响。Fig.2-4Theinfluenceofdifferentfactorsonimputationreliability(A)theinfluenceofreferencepopulationsizeonimputationreliability;(B)theinfluenceoftargetpopulationsiteratioonimputationreliability;(C)theinfluenceofgeneticdistancebetweenreferencepopulationandtargetpopulationonimputationreliability.表2-8不同水平填充可靠性统计信息Table2-8Thesummaryofimputationreliabilityatdifferentlevels填充软件参考群体大小SNP覆盖度/%1510305090Beagle5.11000.210.560.800.970.991.0010000.250.780.940.991.001.0030000.260.900.970.991.001.0050000.260.940.981.001.001.00

【参考文献】:
期刊论文
[1]鸭胸肌肉色性状全基因组关联分析[J]. 刘大鹏,凡文磊,唐静,周正奎,侯水生.  中国畜牧兽医. 2020(05)
[2]全基因组关联分析在畜禽中的研究进展[J]. 汤香,何俊,蒋隽.  畜牧与兽医. 2020(05)
[3]畜禽生长发育相关性状的全基因组关联分析研究进展[J]. 陶林,贺小云,狄冉,刘秋月,胡文萍,王翔宇,储明星.  中国畜牧杂志. 2019(11)
[4]北京地区大白猪基因组联合育种研究[J]. 张金鑫,唐韶青,宋海亮,高虹,蒋尧,江一凡,弥世荣,孟庆利,于凡,肖炜,云鹏,张勤,丁向东.  中国农业科学. 2019(12)
[5]Imputation from SNP chip to sequence: a case study in a Chinese indigenous chicken population[J]. Shaopan Ye,Xiaolong Yuan,Xiran Lin,Ning Gao,Yuanyu Luo,Zanmou Chen,Jiaqi Li,Xiquan Zhang,Zhe Zhang.  Journal of Animal Science and Biotechnology. 2018(02)
[6]基于育种值预测的基因组选择方法的比较(英文)[J]. 王欣,杨泽峰,徐辰武.  Science Bulletin. 2015(10)
[7]基因型填充方法介绍及比较[J]. 何桑,丁向东,张勤.  中国畜牧杂志. 2013(23)
[8]Application of imputation methods to genomic selection in Chinese Holstein cattle[J]. Ziqing Weng, Zhe Zhang, Xiangdong Ding, Weixuan Fu, Peipei Ma, Chonglong Wang and Qin Zhang * Key Laboratory of Animal Genetics Breeding and Reproduction, Ministry of Agriculture, College of Animal Science and Technology, China Agricultural University, Beijing, China.  Journal of Animal Science and Biotechnology. 2012(01)

博士论文
[1]猪耳面积性状全基因组关联分析及主效基因探索[D]. 梁晶.中国农业科学院 2015

硕士论文
[1]猪肋骨数性状全基因组关联分析及LTBP2基因的克隆与表达[D]. 岳静伟.中国农业科学院 2017



本文编号:3625081

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3625081.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户51c74***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com