当前位置:主页 > 社科论文 > 社会保障论文 >

社保领域知识图谱构建及应用研究

发布时间:2022-12-05 06:50
  社会保障制度与民生息息相关,而作为其重要组成部分的社会保险更与本文普通人密不可分。但随着经济的发展,大量的社会保险知识呈现出地域化和碎片化,并且互联网的发展使人们更愿意在网上提出问题。因此,目前亟需构建一个社保领域知识库,并在其之上能够创造应用价值,解决老百姓所遇到的社保问题,而知识图谱可以作为解决以上问题的可行方法。基于以上背景,以自然语言处理技术和神经网络理论作为支撑,本文对社保领域知识图谱构建以及问答技术进行了深入研究。本文的内容主要分为两个模块:社保知识图谱构建与基于知识图谱的问答原型构建。在社保领域知识图谱构建模块中,本文结合社保领域特点提出了一个知识图谱构建框架,主要包括知识的预处理,概念提取,实体识别以及关系抽取四个部分。在预处理部分,本文利用网络爬虫爬取了权威的领域知识并对文本进行去噪。由于社保领域中的概念繁多,为了减少人工参与,所以本文首先利用规则与统计相结合的方法对领域概念进行提取,将构建好的领域概念集合用于分词和标注任务。为了获取知识图谱中的重要组成部分:实体和关系,本文接下来利用经典的BiLSTM-CRF实体识别模型进行社保领域实体识别,并在此基础之针对领域特点... 

【文章页数】:79 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 知识图谱研究现状
        1.2.2 问答技术研究现状
    1.3 论文研究内容
    1.4 论文组织结构
第2章 相关理论与技术
    2.1 语言模型理论
        2.1.1 传统语言模型
        2.1.2 神经概率语言模型
        2.1.3 word2vec模型
    2.2 神经网络相关技术
        2.2.1 卷积神经网络
        2.2.2 循环神经网络
    2.3 条件随机场模型
    2.4 本章小结
第3章 社保领域知识图谱构建
    3.1 引言
    3.2 社保领域知识图谱构建预处理
        3.2.1 知识获取
        3.2.2 数据预处理
    3.3 社保领域概念提取算法
        3.3.1 基于规则的候选概念选取
        3.3.2 基于统计信息的概念筛选
    3.4 社保领域实体识别模型构建
        3.4.1 实体识别模型形式化表示
        3.4.2 实体识别模型构建
    3.5 基于远程监督的社保领域关系抽取框架
        3.5.1 关系实例构建
        3.5.2 关系语义特征选择
        3.5.3 分段卷积神经网络模型构建
        3.5.4 句子级别注意力模型构建
        3.5.5 引入实体描述
    3.6 本章小结
第4章 基于社保领域知识图谱的问答技术
    4.1 引言
    4.2 社保领域问句实体链接
    4.3 社保领域问句关系预测模型构建
        4.3.1 嵌入层
        4.3.2 关系表示层
        4.3.3 问句表示层
        4.3.4 注意力层
        4.3.5 输出层
    4.4 知识图谱形式化查询
    4.5 本章小节
第5章 社保领域知识图谱构建及问答实验
    5.1 实验环境
    5.2 社保领域知识图谱构建实验
        5.2.1 实验数据设置和评价指标
        5.2.2 社保领域概念提取实验
        5.2.3 社保领域实体识别实验
        5.2.4 社保领域关系抽取实验
        5.2.5 社保领域知识图谱持久化
    5.3 基于社保领域知识图谱的问答实验
        5.3.1 实验数据设置和评价指标
        5.3.2 社保领域问句实体抽取实验
        5.3.3 社保领域问句关系预测实验
        5.3.4 问答原型实验
    5.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文和取得的科研成果
致谢


【参考文献】:
期刊论文
[1]中国社会保障体系建设的基本经验与未来展望[J]. 胡晓义.  经济研究参考. 2018(25)
[2]基于中文知识图谱的电商领域问答系统[J]. 杜泽宇,杨燕,贺樑.  计算机应用与软件. 2017(05)
[3]中文信息处理研究现状分析[J]. 宗成庆.  语言战略研究. 2016(06)
[4]统计与规则相融合的领域术语抽取算法[J]. 樊梦佳,段东圣,杜翠兰,张仰森,佟玲玲.  计算机应用研究. 2016(08)
[5]基于条件随机场方法的开放领域新词发现[J]. 陈飞,刘奕群,魏超,张云亮,张敏,马少平.  软件学报. 2013(05)



本文编号:3709902

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shehuibaozhanglunwen/3709902.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户74ef2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]