蛋白质序列的深度建模及其应用

发布时间:2022-11-05 01:32
  蛋白质的生物功能由蛋白质的三维结构决定,而三维结构是由蛋白质序列决定的。在三维结构未知的情况下,分析预测蛋白质分子结构,可帮助人们快速认识蛋白质功能、研究生物病理原因、减少生物实验量等。深度学习方法已在多个领域成功应用,本课题用深度学习方法,从蛋白质一级序列出发,建立深度学习模型,对蛋白质结构相关的典型属性:溶剂可及性、二级结构、骨架二面角和相互作用位点开展预测研究。本文主要工作如下:1.蛋白质溶剂可及性预测。提出一个两阶段的单模型策略:先训练回归模型,预测相对可及表面积;再根据指定阈值,对预测结果再进行分类划分。在双向递归神经网络节点信息融合时,提出了双向节点的融合算子,提升了信息融合能力。实验表明使用三个不同融合算子的SDBRNN模型提高了溶剂可及性预测性能。2.蛋白质二级结构识别。结合递归神经网络长范围特征提取优势和卷积神经网络局部特征提取特点,面向多分类问题,设计深度学习模型CRRNN,捕获序列隐含的局部特性和长程特性。为了解决残差网络跨层合并输入带来模型参数激增的问题,用一维一卷积步的卷积神经网络转换降维。本文中还训练了 10个独立训练的单模型,组合成多模型集成学习。3.蛋白... 

【文章页数】:111 页

【学位级别】:博士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 蛋白质结构属性
        1.2.1 蛋白质
        1.2.2 蛋白质结构
        1.2.3 蛋白质骨架二面角
        1.2.4 残基溶剂可及性
        1.2.5 相互作用位点
    1.3 研究现状分析
        1.3.1 计算问题描述和输入输出
        1.3.2 残基溶剂可及性研究现状
        1.3.3 蛋白质二级结构预测研究现状
        1.3.4 蛋白质相互作用位点预测研究现状
        1.3.5 蛋白质多结构属性预测研究现状
        1.3.6 深度学习在蛋白质组学中的应用
    1.4 研究内容
    1.5 本文结构
第二章 基于蛋白质序列的溶剂可及性预测
    2.1 引言
    2.2 SDBRNN模型结构
        2.2.1 融合算子
        2.2.2 模型设计
        2.2.3 超参数设置
    2.3 实验数据
        2.3.1 实验数据集构建
        2.3.2 输入特征属性和输出标签
    2.4 实验结果与分析
        2.4.1 评价标准
        2.4.2 不同输入特征对模型性能分析
        2.4.3 不同融合算子对结果的影响
        2.4.4 rASA预测结果对比
        2.4.5 二分类预测结果对比
    2.5 本章小结
第三章 基于蛋白质序列的二级结构预测
    3.1 引言
    3.2 CRRNN模型结构
        3.2.1 局部块
        3.2.2 BRNN模块
    3.3 实验数据
        3.3.1 实验数据集构建
        3.3.2 输入输出
    3.4 实验结果与分析
        3.4.1 评价指标
        3.4.2 训练数据集对泛化性能的影响
        3.4.3 模型结构分析
        3.4.4 八状态预测结果
        3.4.5 三状态预测结果
        3.4.6 集成学习
        3.4.7 个案分析
    3.5 本章小结
第四章 基于蛋白质序列的相互作用位点预测
    4.1 引言
    4.2 轻量级LSTM网络
        4.2.1 长短期记忆网络
        4.2.2 LSTM改进模型
        4.2.3 SLSTM
    4.3 DLPred模型结构
        4.3.1 DLPred模型
        4.3.2 算法层面的不平衡分类处理策略
    4.4 实验数据
        4.4.1 面向训练集的不平衡处理
        4.4.2 测试集
        4.4.3 输入属性和输出标签
    4.5 实验结果与分析
        4.5.1 模型结构分析
        4.5.2 不平衡分类处理策略对泛化性能的影响
        4.5.3 独立测试集上性能对比
        4.5.4 集成学习模型性能
        4.5.5 在线服务
    4.6 本章小结
第五章 基于蛋白质序列的多结构属性联合学习
    5.1 引言
    5.2 双通道深度模型的多任务学习
    5.3 实验数据
        5.3.1 实验数据集构建
        5.3.2 输入和输出
    5.4 实验结果与分析
        5.4.1 不同RNN结构性能分析
        5.4.2 不同属性特征对性能的影响
        5.4.3 不同损失函数对RSA预测影响
        5.4.4 和现有方法对比
    5.5 本章小结
第六章 总结与展望
    6.1 工作总结
    6.2 研究展望
参考文献
发表文章目录及科研项目
致谢



本文编号:3701672

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3701672.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户51a1d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com