当前位置:主页 > 科技论文 > 自动化论文 >

基于深度度量学习的少样本基因表达谱癌症分类

发布时间:2024-02-19 18:30
  癌症已经成为全球范围内疾病和死亡的主要原因,对人们身体健康和生活都造成严重的影响。癌症产生的病因多种多样,找出癌症产生的原因和相关治疗方法成为科研工作人员的重要工作。经过科研工作者多年的研究,大多数包括癌症在内的疾病跟人类的基因相关,而人类研究自身基因的一个重要数据来源就是基因表达谱数据。基因表达数据是由生物学者选择一部分人体组织样本,加入指定试剂激活刺激组织内的基因表达,然后使用基因芯片去检测RNA蛋白质表达水平。一方面通过对某些患者及健康人士选取相同组织做基因表达谱数据,可以得到基因表达水平的不同;另一方面通过实验观测药物或者治疗方案对关键基因表达的作用,及观察前后表达水平差异,就可以评估治疗的作用和药物的疗效。因此使用基因表达谱数据对各类癌症进行细致分类,对于癌症诊断治疗有着极其重要的作用。然而在一个基因表达谱数据集中,通常只有几十个样本,而一个样本检测的基因数目高达数万,特征维度和样本数量不均衡导致基因表达谱数据直接使用机器学习模型分类时存在严重的过拟合问题。在生物信息领域使用深度学习来分析基因表达谱数据已经是一个非常重要的应用了。现有的深度学习方法已经在基于大型基因表达谱数据...

【文章页数】:60 页

【学位级别】:硕士

【部分图文】:

图2-1孪生网络结构示意图

图2-1孪生网络结构示意图

哈尔滨工业大学工学硕士学位论文图2-1孪生网络结构示意图。为:L(W)=Pi=1L(W,(Y,X1,X2)i)L(W,(Y,X1,X2)i)=(1Y)LG(EW(X1,X2)i)+YLI(EW(X1,X2)i)(2-12)式中X1和X2———两个输入的样本;Y———X1和X2同类....


图2-2三胞胎网络结构示意图

图2-2三胞胎网络结构示意图

哈尔滨工业大学工学硕士学位论文图2-1孪生网络结构示意图。为:L(W)=Pi=1L(W,(Y,X1,X2)i)L(W,(Y,X1,X2)i)=(1Y)LG(EW(X1,X2)i)+YLI(EW(X1,X2)i)(2-12)式中X1和X2———两个输入的样本;Y———X1和X2同类....


图2-3KNN示意图

图2-3KNN示意图

哈尔滨工业大学工学硕士学位论文知道带问号的球是哪一类,于是找到离问号球最近的五个球,发现五个球中有2个黑的,3个白的,因此判断问号球为白球。图2-3KNN示意图假设样本点X属于n维特征空间X={X1,X2,X3...Xn},第i个样本为Xi=X1i,X2i,X3i...Xdi,X....


图2-4SVM示意图

图2-4SVM示意图

蛄炕?⊿upportVectorMachine,SVM)[48,49]是一种效果优秀、性能良好的二分类器,经过改进后可以用于多分类任务。SVM主要学习计算一个最大边距平面能够将数据集中两类数据集进行区分,且在训练中使用了铰链顺势函数和给雷正则化项来减少过拟合的情况,从而得到一个优....



本文编号:3903136

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3903136.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户546dc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com