当前位置:主页 > 理工论文 > 生物学论文 >

基于强化学习的生物医学实体识别研究与应用

发布时间:2022-07-13 21:24
  生物医学文献的数量浩如烟海,能够挖掘出有价值的生物医学信息具有重要的意义。生物医学实体识别工作是从非结构化的文本中识别出相关的生物医学实体,是进行生物医学关系抽取和构建生物医学知识图谱的重要前提。现阶段的研究方法大多是基于深度学习的,这些方法仍存在很多不足之处,例如容易出现过拟合的问题,并且数据分布不平衡的问题一直没有得到很好的解决。本文提出了一种基于强化学习的生物医学实体识别算法,在传统的基于深度学习方法的基础上,用双向长短记忆神经网络学习单词的上下文语义信息,并将其输出的隐含层状态作为强化学习的输入,利用深度Q学习算法来产生序列的标注,完成标签解码工作。相较于传统的利用前馈型神经网络和条件随机场解码,强化学习模型的解码方法更能学习到长距离的特征。并且通过设置合适的奖励机制,可以有效地避免在监督学习中因为数据噪声或者样本不平衡所带来的干扰。最后通过实验证明了在生物医学实体识别工作上,基于强化学习的方法在性能方面具有明显的优势。本文也将理论与实际相结合,应用生物医学实体识别算法模型,开发了疾病知识提取系统。用户通过系统界面可以查看与神经退行性疾病相关的化合物、致病基因、疾病症状、肽、天... 

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景与意义
    1.2 国内外的研究现状
        1.2.1 生物医学实体识别的研究现状
        1.2.2 强化学习的研究现状
    1.3 本文的主要研究内容
    1.4 文章结构
2 理论基础
    2.1 深度学习
        2.1.1 前馈型神经网络
        2.1.2 长短记忆神经网络
        2.1.3 卷积神经网络
    2.2 条件随机场
    2.3 强化学习
        2.3.1 强化学习过程
        2.3.2 深度Q学习
        2.3.3 策略梯度
3 基于强化学习的生物医学实体识别研究
    3.1 引言
    3.2 相关工作
    3.3 研究方法
        3.3.1 词级别表示
        3.3.2 字符级别表示
        3.3.3 预训练模型
        3.3.4 强化学习模型
    3.4 算法实验与结果分析
        3.4.1 实验语料介绍
        3.4.2 标签和评价指标
        3.4.3 实验环境
        3.4.4 参数设置
        3.4.5 实验结果与分析
    3.5 本章小结
4 基于生物医学实体识别的疾病知识提取系统
    4.1 引言
    4.2 相关工作
    4.3 系统分析
        4.3.1 需求分析
        4.3.2 功能性需求
        4.3.3 非功能性需求
        4.3.4 可行性分析
    4.4 系统设计
        4.4.1 系统架构设计
        4.4.2 系统框架介绍
        4.4.3 系统整体流程结构
    4.5 系统实现与测试
        4.5.1 系统实现
        4.5.2 系统测试
    4.6 本章小结
结论
参考文献
致谢


【参考文献】:
期刊论文
[1]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯.  中文信息学报. 2018(01)
[2]基于B/S结构的实验室管理信息系统开发方案[J]. 张文增,孙振国,赵冬斌,陈强.  计算机工程与应用. 2002(11)

博士论文
[1]生物医学实体关系抽取研究[D]. 赵哲焕.大连理工大学 2017

硕士论文
[1]基于深度学习的生物医学命名实体识别研究[D]. 姜宇新.大连理工大学 2018



本文编号:3660793

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3660793.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户58994***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com