当前位置:主页 > 管理论文 > 移动网络论文 >

基于最大熵的智能提问系统及其在审计中的应用

发布时间:2024-02-21 23:11
  随着信息技术的发展,审计领域的信息量剧增,传统的计算机辅助审计软件在处理这些巨量信息时,逐渐表现出审计周期长、智能化程度低的局限性。为了克服这些局限性,本文提出了智能提问系统。与传统的以查报表为手段的审计方式相比,该系统的灵活性较高,能够迅速确定审计疑点。 本文首先归纳概括了汉语疑问句常用的十大问点类型,然后研究了使用最大熵模型进行问点标注的方法,以标注好的语料为输入生成问句。另外,借鉴犯罪心理测试领域的问题编排技术,对生成的问句进行了筛选编排。本文构造的智能提问系统主要包含两个模块:一个是问句自动生成模块;另一个是问题编排模块。问句自动生成模块使用社会保险领域中的政策文本作为输入,在构建了该领域中常用句型模板的基础上,对文本中的事实和规则实施抽取,并以此为基础生成问句,作为输出。在生成问句时,使用最大熵理论:对社保审计领域具有代表性的政策文本实施人工标注,作为训练语料对最大熵模型进行训练,确定模型参数。然后使用该模型对从文本中抽取出的信息进行标注,将标注后的句子输入到本文所提出的问句生成算法,产生问句。问题编排模块则以生成的问句为基础,借鉴犯罪心理测试领域中的编题技术并结合社保审计领...

【文章页数】:68 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
目录
第1章 绪论
    1.1 研究背景和意义
        1.1.1 研究背景
        1.1.2 研究目的及意义
    1.2 国内外研究现状
        1.2.1 提问技术研究现状
        1.2.2 计算机辅助审计研究现状
    1.3 论文组织结构
第2章 相关理论和技术
    2.1 疑问句及问点类型分析
        2.1.1 汉语疑问句类型
        2.1.2 问点类型分析
    2.2 最大熵原理
        2.2.1 概述
        2.2.2 最大熵原理
        2.2.3 数学框架
        2.2.4 参数估计
        2.2.5 模型优缺点
    2.3 本章小结
第3章 问句自动生成及问题编排
    3.1 文本预处理
        3.1.1 文本信息抽取
        3.1.2 分词及词性标注
    3.2 基于最大熵模型的问点标注
        3.2.1 特征模板构建
        3.2.2 候选特征生成
        3.2.3 基本特征选取
        3.2.4 最大熵模型训练及问点标注
    3.3 问句自动生成
        3.3.1 事实性问句生成
        3.3.2 规则性问句生成
    3.4 问题编排
        3.4.1 犯罪心理分析及测试
        3.4.2 问题编排
    3.5 本章小结
第4章 系统实现及分析
    4.1 系统结构
    4.2 系统实现及结果分析
        4.2.1 实验数据
        4.2.2 系统界面
        4.2.3 信息抽取
        4.2.4 最大熵模型训练
        4.2.5 问句生成模块
    4.3 本章小结
结论
参考文献
攻读硕士学位期间发表的论文和取得的科研成果
致谢



本文编号:3906031

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3906031.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ab2e2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]