当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的蛋白酶裂解位点的预测研究

发布时间:2023-04-09 21:54
  在系统水平控制下,蛋白水解的调节在各种重要的细胞过程(如血液凝固、细胞增殖和细胞凋亡等)中起关键作用。确认和识别蛋白酶的真实底物蛋白是我们更好地理解这一过程的机制的关键所在。为了解决这个问题,基于之前开发的PROSPER工具,我们开发了PROSPER2.0,用于准确预测蛋白酶底物特异性及其切割位点。PROSPER 2.0旨在为蛋白质裂解位点预测覆盖更多的蛋白酶(多达38种蛋白酶)以及提供更好的预测性能。PROSPER 2.0在框架结构上整合了来自多个级别的异构的序列以及结构的特征,同时结合了两层的特征选择方法。交叉验证和独立测试的结果表明,PROSPER 2.0能够实现比现有通用工具更具竞争力的性能,并将促进假设驱动的新型底物发现。针对基质金属蛋白酶(MMP)的六种蛋白酶数据集,我们提出了基于知识迁移的计算框架,通过迁移其他MMPs的隐含的有用信息来增强底物裂解位点预测的性能。该框架使用支持向量机结合迁移学习的思想和特征选择的方法实现。结果表明该方法和传统的特征选择方法相比,在六个数据集上各有其优势,为MMP底物裂解位点的预测提供了有用的新的思路。

【文章页数】:97 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 论文的研究背景和意义
    1.2 国内外研究现状分析
    1.3 研究的主要内容和核心问题
    1.4 论文结构
第二章 蛋白酶底物裂解位点数据集的构建
    2.1 引言
    2.2 相关数据库及工具
        2.2.1 MEROPS数据库
        2.2.2 Uniprot数据库
        2.2.3 DAVID在线平台
        2.2.4 Gene Ontology数据库
        2.2.5 KEGG Pathway数据库
        2.2.6 CD-HIT
    2.3 蛋白酶底物裂解位点数据集的构建
    2.4 本章小节
第三章 蛋白质序列特征编码及提取
    3.1 引言
    3.2 蛋白质序列特征的预测计算
        3.2.1 二级结构特征的预测
        3.2.2 蛋白质序列的无序蛋白结构信息
        3.2.3 蛋白质序列的溶剂可及性信息
        3.2.4 蛋白质序列的位置特异性打分矩阵的计算
    3.3 数据集的划分与样本采样
        3.3.1 数据集的划分
        3.3.2 正样本的选择
        3.3.3 负样本的选择
    3.4 蛋白质序列特征编码方法
    3.5 蛋白质序列编码流程
    3.6 本章小节
第四章 特征选择与知识迁移
    4.1 引言
    4.2 基于mRMR特征选择框架的介绍
        4.2.1 特征的重要性分析
    4.3 知识迁移的使用
        4.3.1 背景及意义
        4.3.2 算法流程及描述
    4.4 并行计算架构的使用
    4.5 本章小节
第五章 模型构建及性能分析
    5.1 引言
    5.2 SVM算法介绍
    5.3 模型评价指标介绍
    5.4 PROSPER2.0 模型的构建和性能分析
        5.4.1 数据处理及模型构建流程图
        5.4.2 不同编码方法的比较
        5.4.3 不同工具间的比较
        5.4.4 蛋白质组扫描
        5.4.5 案例研究
    5.5 基于知识迁移的模型的构建和性能分析
        5.5.1 模型构建概述
        5.5.2 公共特征性能评估
        5.5.3 迁移学习与特征选择模型性能的对比
        5.5.4 独立测试
    5.6 蛋白酶特异性底物裂解位点预测计算平台的开发及构建
    5.7 本章小节
第六章 总结与展望
    6.1 主要工作及贡献
    6.2 未来工作展望
参考文献
致谢
攻读学位期间发表的学术论文



本文编号:3787799

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3787799.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e0e3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com