当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的基因表达数据处理在药效预测上的应用

发布时间:2022-12-04 17:43
  药物的早期筛选通常需要经过药物设计、细胞实验、动物实验与临床实验等步骤,一个新药的研发与筛选通常需要耗费将近十年的时间以及上百亿元,而这些花费可能因药物在人体中的不适应性、无效性、毒性等原因而无效。因此,基于人类细胞的基因表达数据与深度学习方法相结合,对新药物效应预测的研究能够减少药物的早期筛选过程中的额外花费,并为提升新药探索的成功率作出贡献。本文利用寻找拓扑图中最短路径的算法来对基因互作网络的上下文来进行捕捉,并将捕捉到的基因上下文用于训练机器学习算法,生成最终能够代表每个基因功能与意义的基因向量。基于这些基因向量与细胞的基因表达数据,最终整合出能够代表每个细胞各方面状态的细胞向量,并通过查看药物处理前后细胞状态的改变来判断药物对细胞的效应。这种方式能够从更宏观的,即整个细胞的状态变化角度,来判断药物在人类细胞中产生的效应。为了预测药物对人类细胞基因表达的改变,本文构建了以药物分子结构为输入,细胞状态变化为输出的深度学习模型,并将训练后的模型应用并预测模型未曾学习过的小分子药物对细胞状态所产生的效应,取得了良好的预测效果;证明了深度学习应用于药物早期筛选、预测细胞基因表达状态变化的... 

【文章页数】:99 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题背景及研究的目的和意义
    1.2 基因表达数据
        1.2.1 基因表达数据简介
        1.2.2 基因表达数据传统表示与数据内容
        1.2.3 基因表达数据传统处理与分析方法
    1.3 基因互作网络
    1.4 机器学习
        1.4.1 机器学习简介
        1.4.2 t-分布随机邻域嵌入
    1.5 深度学习
        1.5.1 词嵌入
        1.5.2 图卷积神经网络
        1.5.3 注意力机制
        1.5.4 门控机制
        1.5.5 迁移学习——预训练与微调
    1.6 迪杰斯特拉算法
    1.7 化合物分子结构的表征
    1.8 基于深度学习的化合物表征对细胞效应的预测
    1.9 基于机器学习的化合物结构与基因表达数据对细胞效应的预测
    1.10 本文的研究内容和技术路线
第2章 计算方法、模型与过程
    2.1 基因向量的生成
        2.1.1 数据来源与处理
        2.1.2 广义的基因互作网络信息流上下文捕捉
        2.1.3 word2vec生成基因向量
    2.2 细胞向量的生成
        2.2.1 数据来源与处理
        2.2.2 从基因向量到细胞向量
    2.3 深度学习预测化合物性质——预训练
        2.3.1 数据来源与处理
        2.3.2 预测模型构建
        2.3.3 预训练模型超参数调整
    2.4 化合物对细胞效应的深度模型——微调
        2.4.1 数据来源与处理
        2.4.2 干扰细胞改变预测模型构建
        2.4.3 微调模型超参数调整
    2.5 本章小结
第3章 基因向量与细胞向量的评价
    3.1 基因向量的评价
        3.1.1 与细胞粘附功能相关基因
        3.1.2 与细胞周期功能相关基因
        3.1.3 与细胞分化功能相关基因
        3.1.4 与细胞迁移功能相关基因
        3.1.5 与发育功能相关基因
        3.1.6 与DNA修复功能相关基因
        3.1.7 与DNA复制功能相关基因
        3.1.8 与免疫反应功能相关基因
        3.1.9 与RNA剪切功能相关基因
    3.2 细胞向量的评价
        3.2.1 皮肤组织细胞的细胞向量
        3.2.2 肺部组织细胞的细胞向量
        3.2.3 肾组织细胞的细胞向量
        3.2.4 肝组织细胞的细胞向量
        3.2.5 大肠组织细胞的细胞向量
        3.2.6 乳腺组织细胞的细胞向量
        3.2.7 前列腺组织细胞的细胞向量
        3.2.8 正常细胞、原代细胞与癌细胞的区分
    3.3 本章小结
第4章 化合物预测干扰细胞改变的模型结果评价
    4.1 训练数据集与验证数据集结果
        4.1.1 预训练
        4.1.2 微调
    4.2 测试数据集结果
    4.3 实例比较
        4.3.1 帕博西尼的预测值与实验值比较
        4.3.2 拉帕替尼的预测值与实验值比较
        4.3.3 博苏替尼的预测值与实验值比较
        4.3.4 舒尼替尼的预测值与实验值比较
        4.3.5 利尼伐尼的预测值与实验值比较
    4.4 本章小结
结论与展望
参考文献
附录1 所引用图片的版权许可相关材料
攻读硕士学位期间发表的论文及其它成果
致谢


【参考文献】:
期刊论文
[1]机器学习在数据挖掘中的作用[J]. 周昕,王小玉.  电脑学习. 2010(03)
[2]基于2D分子指纹的分子相似性方法在虚拟筛选中的应用[J]. 唐玉焕,林克江,尤启冬.  中国药科大学学报. 2009(02)



本文编号:3708709

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3708709.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户bfbcc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]