当前位置:主页 > 科技论文 > 搜索引擎论文 >

财经问答系统结构化查询子系统的设计与实现

发布时间:2017-04-09 03:04

  本文关键词:财经问答系统结构化查询子系统的设计与实现,由笔耕文化传播整理发布。


【摘要】:近年来,搜索引擎已经成为各大公司都涉及的领域,搜索主要分为两个领域,一个领域就是全领域的搜索,这种搜索基本覆盖人们的基本生活。另一个领域就是专业领域搜索,这种搜索主要是以专门研究一个领域进行探索。目前,对于财经领域的搜索引擎少之又少,为了让用户能够根据自己的意愿随意搜索自己想要了解的股票信息,搜牛项目组提出了i问财项目,该项目致力于给用户提供更快捷、更专业、更准确的金融问答体验。 本文主要针对财经领域,针对选股问题的自然语言处理进行研究,最终完成系统的开发和测试。本系统主要完成的工作包括对问句的后续解析和查询。其中问句后续解析部分主要是根据已经生成的语义树转化为搜索需要用到的查询信息,查询部分主要是根据问句解析生成的结构化查询条件转化为查询指令分别在各个数据源查询,最终将搜索到的结果返回给用户。本系统主要使用Java语言开发,具体模块主要包括以下六个部分:结构化条件列表的解析、专题解析、指标累加、数据查询、Web端解析和Web交互数据反解析。通过这六个部分的设计,完成了从语义树到数据返回的结构化查询。 目前搜索涉及到的数据库主要包括关系型数据库和非关系型数据库,关系型数据库搜索面对目前大数据量的搜索效率很低,而各种非关系型数据库在使用方面又千差万别。本文对自然语言处理的语义树进行结构化的存储,采用多种非关系型数据库对不同种类的数据进行存储和查询,使得语义树在应用方面更加方便,同时多种非关系型数据库的应用使得数据查询效率更高。因为每种非关系型数据库应用方式不同,在实现过程中对多种非关系型数据库的调用进行封装,这就保证了在后续的数据库维护上的任何改动都不会影响到结构化条件树的部分,同时多种数据库调用的封装也提高了代码的可重用性。本项目采用了大量的优化方案和设计模式,从而提高了系统效率和后期优化。 最后对所有的功能和性能进行测试,,保证了系统的功能完整性和性能的优良,达到了预期的目标。本系统已经上线,根据每日用户问句统计,去重后用户问句每日约50000句,解析正确的比例约92%,达到了预期要求。
【关键词】:搜索引擎 结构化查询 问答系统
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.52
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 绪论9-14
  • 1.1 课题来源及目的与意义9-10
  • 1.1.1 课题来源9
  • 1.1.2 课题研究的目的和意义9-10
  • 1.2 国内外相关领域研究现状10-12
  • 1.2.1 问答系统现状10-11
  • 1.2.2 非关系型数据库发展现状11-12
  • 1.3 本文的主要研究内容12-14
  • 第2章 结构化查询子系统需求分析14-20
  • 2.1 业务需求14-15
  • 2.2 功能需求15-18
  • 2.3 非功能需求18-19
  • 2.4 本章小结19-20
  • 第3章 结构化查询子系统设计与实现20-72
  • 3.1 结构化查询系统总体设计方案20-24
  • 3.1.1 财经问答系统简介20-21
  • 3.1.2 结构化查询子系统功能设计21-24
  • 3.2 结构化条件列表解析的设计与实现24-32
  • 3.2.1 结构化条件列表解析配置文件说明24-25
  • 3.2.2 结构化条件列表解析的设计25-28
  • 3.2.3 结构化条件列表解析的实现28-32
  • 3.3 专题解析的设计与实现32-38
  • 3.3.1 专题解析配置文件说明32-33
  • 3.3.2 专题解析的设计33-35
  • 3.3.3 专题解析的实现35-37
  • 3.3.4 专题解析功能结果展示37-38
  • 3.4 指标累加功能的设计与实现38-49
  • 3.4.1 指标累加配置文件说明38-39
  • 3.4.2 指标累加模块的设计39-40
  • 3.4.3 指标累加功能的实现40-47
  • 3.4.4 指标累加功能结果展示47-49
  • 3.5 数据查询的设计与实现49-58
  • 3.5.1 数据查询功能的设计49-51
  • 3.5.2 数据查询功能的实现51-56
  • 3.5.3 数据查询功能结果展示56-58
  • 3.6 WEB端解析的设计与实现58-67
  • 3.6.1 Web端解析功能的设计58-61
  • 3.6.2 Web端解析功能的实现61-66
  • 3.6.3 Web端解析结果展示66-67
  • 3.7 WEB交互数据反解析的设计与实现67-71
  • 3.7.1 Web交互数据反解析功能的设计67-68
  • 3.7.2 Web交互数据反解析功能的实现68-70
  • 3.7.3 Web交互数据反解析结果展示70-71
  • 3.8 本章小结71-72
  • 第4章 结构化查询子系统测试72-81
  • 4.1 测试方案72
  • 4.1.1 功能测试72
  • 4.1.2 性能测试72
  • 4.2 测试环境72
  • 4.3 系统测试结果和评价72-79
  • 4.3.1 功能测试结果72-78
  • 4.3.2 性能测试结果78-79
  • 4.4 系统评价79-81
  • 4.4.1 系统优点79-80
  • 4.4.2 系统改进80-81
  • 结论81-82
  • 参考文献82-86
  • 致谢86-87
  • 个人简历87

【参考文献】

中国期刊全文数据库 前9条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 樊孝忠,李宏乔,李良富,叶江;银行领域汉语自动问答系统BAQS的研究与实现[J];北京理工大学学报;2004年06期

3 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期

4 潘凡;;从MySQL到MongoDB——视觉中国的NoSQL之路[J];程序员;2010年06期

5 邓志鸿,唐世渭,杨冬青;面向语义集成——本体在Web信息集成中的研究进展[J];计算机应用;2002年01期

6 姜龙翔;王鑫;李旭;冯志勇;;一种大规模RDF语义数据的分布式存储方案[J];计算机应用与软件;2011年11期

7 曹树金,马利霞;论本体与本体语言及其在信息检索领域的应用[J];情报理论与实践;2004年06期

8 吕明育;李小勇;;NoSQL数据库与关系数据库的比较分析[J];微型电脑应用;2011年10期

9 冯志伟;;自然语言问答系统的发展与现状[J];外国语(上海外国语大学学报);2012年06期


  本文关键词:财经问答系统结构化查询子系统的设计与实现,由笔耕文化传播整理发布。



本文编号:294295

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/294295.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4619f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com