当前位置:主页 > 科技论文 > 搜索引擎论文 >

大型企业管理系统中实时搜索引擎应用研究

发布时间:2017-04-06 09:16

  本文关键词:大型企业管理系统中实时搜索引擎应用研究,由笔耕文化传播整理发布。


【摘要】:信息技术的发展带动了企业信息化的迅猛发展,在大型企业信息管理系统中,信息数量往往非常巨大,且数据的增长、更新速度非常快。而传统的搜索引擎,对于数据检索的实时性及精确性都存在着缺陷。另一方面,企业信息检索系统提供的数据库检索功能在面对海量的企业信息时,它的检索速度会大幅降低,且性能往往满足不了用户的需求,甚至会给数据库的其他正常使用带来影响。针对以上情况,本文构建了基于Lucene的实时检索系统。 本文首先分析了目前企业信息系统中检索系统存在的问题,研究了设计实时检索系统的必要性,进一步研究了搭建实时检索系统所需要的关键技术,包括索引、分词、合并索引段等。此外,就Lucene的主要技术及实现方法进行了研究与探讨,在此基础上,对系统进行了需求分析,探讨、研究了实时检索的构建方法,提出了优化方案,给出了系统的总体解决方案及软件分层设计。 针对普通检索系统中索引处于离线工作的状态,本系统创造性地将索引的建立与查询写入同一进程,并采用多个索引共同工作的方式,保证了文档在添加、删除、更新状态下对应的索引更新的即时性。还在系统中设计增加了搜索系统核心控制模块,它是一个对外的核心类,提供了诸多方法供外界调用。该模块对数据域及查询服务进行统一控制,实现了实时检索。此外,系统采用Servlet和Ajax构建检索交互程序,在本系统的数据结构的基础上,构建了灵活的查询和管理平台。 最后,本文对系统的查询效果进行了测试,并且针对此结果,与基本的Lucene搜索引擎查询进行性能及效果的比较,证明了系统性能明显提高,达到了预期研究目的,满足大数据量及实时性的需求。
【关键词】:实时检索 Lucene 数据库 索引
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要4-5
  • ABSTRACT5-7
  • 目录7-10
  • 第一章 绪论10-13
  • 1.1 实时搜索的研究背景及意义10
  • 1.2 发展现状10-11
  • 1.3 本文主要研究内容11-12
  • 1.4 论文内容章节安排12-13
  • 第二章 相关概念及支撑技术13-28
  • 2.1 搜索引擎13-16
  • 2.1.1 概念13
  • 2.1.2 几种主流的搜索引擎13-15
  • 2.1.3 搜索引擎工作原理15-16
  • 2.2 Lucene基础知识16-23
  • 2.2.1 Lucene简介16
  • 2.2.2 基本概念16-18
  • 2.2.3 Lucene索引倒排表18-19
  • 2.2.4 Lucene总体架构19-20
  • 2.2.5 关键技术20-23
  • 2.3 数据库23-27
  • 2.3.1 概念23
  • 2.3.2 发展现状23-25
  • 2.3.3 ORALCE关键技术25-27
  • 2.4 JAVA设计模式27-28
  • 第三章 实时检索系统的需求和设计28-47
  • 3.1 系统总体需求设计28-29
  • 3.1.1 检索需求28-29
  • 3.1.2 索引需求29
  • 3.1.3 数据管理需求29
  • 3.2 系统的架构设计29-34
  • 3.2.1 总体解决方案29-32
  • 3.2.2 系统分层设计32-34
  • 3.3 搜索引擎34-37
  • 3.3.1 Paoding Analyzer分词35-36
  • 3.3.2 Merge segment合并索引段36-37
  • 3.4 搜索系统核心控制SearchCore37-38
  • 3.5 索引设计38-41
  • 3.6 数据库41-44
  • 3.7 查询44-45
  • 3.8 管理45-47
  • 3.8.1 优化45-46
  • 3.8.2 监视46-47
  • 第四章 实时检索系统的实现47-63
  • 4.1 系统开发环境47-48
  • 4.2 基础架构的搭建48-49
  • 4.2.1 准备工作48
  • 4.2.2 系统搭建与部署48-49
  • 4.2.3 数据库的配置49
  • 4.3 建立基本搜索引擎49-52
  • 4.3.1 基本部署49-50
  • 4.3.2 Paoding Analyzer分词50
  • 4.3.3 Merge Segment合并索引段50-52
  • 4.4 搜索系统核心控制模块SearchCore的配置52-55
  • 4.4.1 SearchCore的基本配置52-54
  • 4.4.2 SearchCore的初始化54-55
  • 4.5 索引配置55-58
  • 4.5.1 内存索引中文档的添加55-56
  • 4.5.2 内存索引与硬盘索引的合并56-57
  • 4.5.3 索引的删除57-58
  • 4.6 数据库58-59
  • 4.7 查询59-61
  • 4.8 管理61-63
  • 4.8.1 优化61
  • 4.8.2 监视61-63
  • 第五章 系统测试63-66
  • 5.1 验证测试63-64
  • 5.2 性能测试64-65
  • 5.2.1 数据库内容64-65
  • 5.2.2 查询时间65
  • 5.2.3 索引建立时间65
  • 5.3 结论65-66
  • 第六章 总结与展望66-68
  • 6.1 论文总结66
  • 6.2 未来展望66-68
  • 参考文献68-69
  • 附录 缩略语69-70
  • 致谢70

【参考文献】

中国期刊全文数据库 前5条

1 王亚平;;Sybase数据库性能优化研究[J];计算机光盘软件与应用;2012年04期

2 王军庄;常鲜戎;顾卫国;;基于OCL技术的Oracle数据库数据快速存取研究[J];电力系统保护与控制;2009年09期

3 王莉云;王华;陈刚;姚乃明;;基于Lucene的全文检索系统的设计与实现[J];计算机工程与设计;2007年24期

4 张永霞;;关于SQL数据库的分析与探讨[J];数字技术与应用;2011年10期

5 仇雷;;从容应对变化——从一个简单搜索工具架构浅谈Java设计模式[J];科技资讯;2010年13期


  本文关键词:大型企业管理系统中实时搜索引擎应用研究,由笔耕文化传播整理发布。



本文编号:288636

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/288636.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9eb57***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com