当前位置:主页 > 科技论文 > 搜索引擎论文 >

IT领域问答系统的研究与实现

发布时间:2017-05-21 08:28

  本文关键词:IT领域问答系统的研究与实现,,由笔耕文化传播整理发布。


【摘要】:随着互联网的发展和应用,网上的信息迅速增长。人们希望能从海量的网络内容获取自己所需要的信息。搜索引擎的出现从很大程度上解决了这个问题。人们只需输入一些关键字,搜索引擎就会返回相关的网页。但是面对繁多的网页信息,用户很难迅速找到自己所需的内容。因此,为了满足人们能够更快速、准确地获取信息的愿望,自动问答系统(automatic Question Answering System,QA)逐渐发展起来。自动问答系统允许用户使用自然语言进行提问,并针对问题返回一个简洁准确的答案。它综合运用多种自然语言处理技术,是计算机应用领域研究的热点之一。目前,英文问答系统的研究已比较成熟,由于中文自然语言的复杂性,因此中文问答系统的研究还处于初步阶段。本文研究的是基于IT领域中文自动问答系统。本文根据IT领域数据的特点,开发出一个在中华字库项目下基于常用问题库(FAQ)的中文问答系统。本系统主要完成对IT领域数据的构建,计算句子相似度算法等方面的内容。在构建IT领域数据部分,研究设计了IT领域数据结构、FAQ存储方式、对FAQ进行预处理;句子相似度计算部分,采用了基于语义的相似度计算方法,并建立了相应的问题测试集进行试验,文章最后介绍了整个自动问答系统的实验结果及其评价。本文的主要工作包括:(1)分析了IT领域数据组成。本文涉及的IT领域数据包括QA数据、IT领域词典、专家问答库。(2)使用ICTCLAS分词技术,实现对问题的分词处理。使用基于语义的句子相似度计算方法,对用户问题与数据库中问题进行相似度的计算,从数据库中寻找匹配的问句及答案返回给用户。(3)开发出一个FAQ自动问答系统,为中华字库项目使用人员提供了关于项目的常见问题的解答。
【关键词】:FAQ问答系统 问句相似度 知网
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
  • 摘要5-6
  • Abstract6-12
  • 第一章 绪论12-17
  • 1.1 前言12
  • 1.2 国内外研究现状12-14
  • 1.2.1 国外研究现状12-13
  • 1.2.2 国内研究现状13-14
  • 1.3 立题意义14-15
  • 1.4 本文的工作内容15
  • 1.5 论文的组织结构15-16
  • 1.6 本章小结16-17
  • 第二章 相关技术研究17-33
  • 2.1 问答系统核心研究模块17-19
  • 2.2 中文自动分词技术19-21
  • 2.2.1 中文自动分词的意义19-20
  • 2.2.2 中文自动分词的方法20-21
  • 2.3 语义词典资源21-25
  • 2.3.1《知网》词典介绍21-22
  • 2.3.2《知网》的结构22
  • 2.3.3《同义词词林》介绍22-25
  • 2.4 词语的相似度计算25-28
  • 2.4.1 基于《同义词词林》的计算25-27
  • 2.4.2 基于《知网》的计算27-28
  • 2.4.3 词语相似度计算评价28
  • 2.5 句子的相似度计算[44]28-32
  • 2.5.1 句子相似度的概念28-29
  • 2.5.2 基于向量空间模型的TF-IDF方法29-30
  • 2.5.3 基于语义依存的计算30
  • 2.5.4 基于语义距离的计算30-31
  • 2.5.5 编辑距离计算方法31
  • 2.5.6 语句相似度计算的评价31-32
  • 2.6 本章小结32-33
  • 第三章 IT领域数据组成和构建33-39
  • 3.1 概述33
  • 3.2 QA数据库33-35
  • 3.2.1 QA数据结构34
  • 3.2.2 数据存储结构34-35
  • 3.3 IT领域词典35-37
  • 3.3.1 IT领域词典概念35
  • 3.3.2 IT领域词典建立35-37
  • 3.4 专家问答库37-38
  • 3.4.1 索引表的建立37-38
  • 3.5 本章小结38-39
  • 第四章 问答系统的总体设计39-46
  • 4.1 问答系统设计框架39
  • 4.2 问句理解部分39-42
  • 4.2.1 分词系统40
  • 4.2.2 问句分类40-41
  • 4.2.3 关键词提取41-42
  • 4.2.4 关键词扩展42
  • 4.3 信息检索部分42-44
  • 4.3.1 确定FAQ候选集43
  • 4.3.2 词语相似度计算43
  • 4.3.3 句子相似度计算43-44
  • 4.4 答案抽取部分44
  • 4.4.1 相似度排序44
  • 4.5 本章小结44-46
  • 第五章 需求分析与概要设计46-64
  • 5.1 需求分析概述46
  • 5.1.1 功能简介46
  • 5.2 功能需求46-55
  • 5.2.1 模块划分46-47
  • 5.2.2 基本设计用例47-55
  • 5.3 概要设计55-56
  • 5.3.1 系统功能结构55-56
  • 5.4 模块设计56-60
  • 5.4.1 模块名称及功能56-59
  • 5.4.2 限制条件59-60
  • 5.5 运行设计60
  • 5.5.1 运行模块组合60
  • 5.5.2 运行控制60
  • 5.6 数据结构设计60-63
  • 5.6.1 数据库概念设计60-63
  • 5.6.2 数据结构与程序的关系63
  • 5.7 系统出错处理63
  • 5.7.1 出错信息63
  • 5.7.2 补救措施63
  • 5.8 本章小结63-64
  • 第六章 问答系统的实现64-71
  • 6.1 系统总体支撑框架64-65
  • 6.2 系统总体架构65
  • 6.3 模块设计65-70
  • 6.3.1 QA知识管理模块65-67
  • 6.3.2 QA知识问答模块67-68
  • 6.3.3 用户管理模块68-69
  • 6.3.4 权限管理模块69
  • 6.3.5 公告管理模块69-70
  • 6.4 本章小结70-71
  • 第七章 实验结果与分析71-79
  • 7.1 实验环境与性能指标71-72
  • 7.1.1 实验环境71
  • 7.1.2 实验性能指标71-72
  • 7.2 功能测试72-74
  • 7.3 界面展示74-76
  • 7.4 实验结果与分析76-78
  • 7.5 本章小结78-79
  • 第八章 总结与展望79-81
  • 8.1 总结79
  • 8.2 展望79-81
  • 参考文献81-83
  • 攻读硕士学位期间取得的研究成果83-84
  • 致谢84-85
  • 附件85

【相似文献】

中国期刊全文数据库 前10条

1 毛先领;李晓明;;问答系统研究综述[J];计算机科学与探索;2012年03期

2 莫丽萍,王树西,姜吉发,雷雨霞;问答系统和浅层结构模式推理[J];广西师范大学学报(自然科学版);2004年01期

3 卢志坚,张冬茉;中文问答系统中的问句理解[J];计算机工程;2004年18期

4 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期

5 林晓庆;;问答系统中基于列表类问题的研究[J];电脑知识与技术(学术交流);2007年07期

6 张积宾;徐志明;王恒;潘启树;;面向大规模网络数据的社会化问答系统[J];哈尔滨工业大学学报;2008年12期

7 贾君枝;毛海飞;;汉语框架网络问答系统问句处理研究[J];图书情报工作;2008年10期

8 胡小华;刘轩;刘丹;陆伟;;基于冗余的仿真问答系统的轻量级局部文本分析[J];图书情报知识;2009年01期

9 张中峰;李秋丹;;社区问答系统研究综述[J];计算机科学;2010年11期

10 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期

中国重要会议论文全文数据库 前10条

1 何靖;陈

本文编号:383137


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/383137.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d4930***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com