当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于一种文档表示模型的站内搜索引擎设计与实现

发布时间:2017-08-17 06:27

  本文关键词:基于一种文档表示模型的站内搜索引擎设计与实现


  更多相关文章: lucene 站内搜索引擎 搜索引擎 信息检索


【摘要】:根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体,在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Lucene是一个用java语言开发的开源的全文搜索引擎架构.本文利用Lucene设计和实现一个基于查询与内容的文档表示模型的站内搜索引擎,实验结果表明该模型能有效的提高信息检索的查准率.
【作者单位】: 南华大学计算机科学与技术学院;
【关键词】lucene 站内搜索引擎 搜索引擎 信息检索
【基金】:湖南省自然科学基金资助项目(11JJ6047) 衡阳市科技计划基金资助项目(2011KJ14;2013KG67) 湖南省科技计划基金资助项目(2011FJ3087) 南华大学计算机科学与技术校级重点学科基金资助项目
【分类号】:TP391.3
【正文快照】: 0引言随着互联网快速地发展与广泛地普及,互联网上的信息量也在迅猛的增加,这使得大家想方便和快捷地在互联网上查询所需信息成为一种奢望.搜索引擎技术的出现有效的缓解了这一问题,并越来越成为人们关注的焦点.随着信息化在我国的逐步推进,许多企事业单位、政府都有了自己的

【参考文献】

中国期刊全文数据库 前2条

1 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期

2 阳小华;周座;;基于查询与内容的文档表示模型[J];南华大学学报(自然科学版);2010年01期

【共引文献】

中国期刊全文数据库 前10条

1 王智强;李蕾;王枞;;基于决策树的汉语代词共指消解[J];北京邮电大学学报;2006年04期

2 张素香;李蕾;谭咏梅;;特定领域下关系模板的研究[J];北京邮电大学学报;2006年05期

3 祝庚;;一种自然语言理解语法分析器的算法实现[J];东莞理工学院学报;2006年03期

4 肖峰;;信息、信息技术与信息认识论[J];长沙理工大学学报(社会科学版);2013年01期

5 姚双云;;小句中枢理论的应用与复句信息工程[J];汉语学报;2005年04期

6 赵慧臣;;知识可视化视觉表征的分析框架[J];开放教育研究;2010年05期

7 陈彦萍;李增智;;语用Web服务管理框架[J];解放军理工大学学报(自然科学版);2008年05期

8 马竹根;一种自然语言理解中语法分析的算法设计和实现[J];计算机时代;2005年10期

9 刘德喜;吴世汉;万常选;;XML文本自动文摘研究综述[J];计算机应用研究;2009年11期

10 滕弘飞;王奕首;史彦军;;人机结合的关键支持技术[J];机械工程学报;2006年11期

中国重要会议论文全文数据库 前3条

1 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

2 张莹莹;段翔;周彬;王晓云;;移动通信网络中的内容安全[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年

3 龙丽霞;李蕾;钟义信;;一种基于实例语境的汉语语音识别后文本检错纠错方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

中国博士学位论文全文数据库 前10条

1 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年

2 马玉涛;在线客户评论的产品族设计与加工方法研究[D];华中科技大学;2012年

3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年

4 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年

5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年

6 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年

7 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年

8 李卫;领域知识的获取[D];北京邮电大学;2008年

9 王奕首;卫星有效载荷配置和布局设计方法[D];大连理工大学;2008年

10 胡东滨;决策问题管理系统及其开发组件研究[D];中南大学;2008年

中国硕士学位论文全文数据库 前10条

1 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年

2 武丽平;基于语用信息的中文专利检索系统[D];北京邮电大学;2011年

3 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年

4 秦磊;机械零部件本体构建与集成关键技术研究[D];山东科技大学;2011年

5 姜俊;基于生物实体语境的语音识别后文本纠错算法研究[D];北京邮电大学;2012年

6 裘剑;工作流系统及其资源描述和管理研究[D];北京邮电大学;2006年

7 余建华;基于统计原理的甄别算法的研究与应用[D];南京工业大学;2006年

8 许晶;基于智能手机平台的语音识别后文本处理的应用[D];北京邮电大学;2007年

9 吴云;基于词汇语义色彩分析的文本倾向识别[D];北京邮电大学;2008年

10 蔡洁;中文子句语义角色标注系统实现研究[D];北京邮电大学;2008年

【二级参考文献】

中国期刊全文数据库 前3条

1 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期

2 钟义信;知行学引论——信息 知识 智能的统一理论[J];中国工程科学;2004年06期

3 张敏,宋睿华,马少平;基于语义关系查询扩展的文档重构方法[J];计算机学报;2004年10期

【相似文献】

中国期刊全文数据库 前10条

1 张民朝;;面向课程信息的专题搜索引擎的设计[J];制造业自动化;2011年06期

2 李静柏;;融合分类特征的信息检索技术研究[J];黑龙江科技信息;2011年11期

3 周登朋;谢康林;;Lucene搜索引擎[J];计算机工程;2007年18期

4 詹自熬;陶斌;;基于Lucene的搜索引擎研究[J];河南工程学院学报(自然科学版);2008年04期

5 张晓卫;朱巧明;;一种基于Lucene的Web全文信息检索系统的设计与实现[J];计算机与现代化;2006年12期

6 钟瑞琼;周黎;韩德志;;中小型网站站内搜索引擎的设计与实现[J];现代计算机(专业版);2011年08期

7 喻金平;谭鸣;夏小云;;基于Lucene技术的垂直搜索引擎的研究[J];软件导刊;2008年03期

8 拥措;;基于LUCENE的藏文全文检索的研究[J];西藏大学学报(自然科学版);2009年01期

9 李永春;丁华福;;Lucene的全文检索的研究与应用[J];计算机技术与发展;2010年02期

10 栾静;李军锋;;基于Lucene全文检索引擎的应用研究[J];计算机与数字工程;2010年12期

中国重要会议论文全文数据库 前10条

1 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

2 孙金立;李路路;王栋;;生物信息检索教学网的建设[A];向数字化转型的图书馆工作[C];2004年

3 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

4 孙金立;李路路;董明强;;建立生物信息检索教学网的研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年

5 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

6 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

7 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

8 于志刚;杨金生;;农业机械网络书签[A];第十三次全国农机维修学术会议论文集[C];2007年

9 ;前言[A];第四届全国信息检索与内容安全学术会议论文集(下)[C];2008年

10 田田;马军;李跃军;;应用多本体进行信息检索的研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

中国重要报纸全文数据库 前10条

1 希安;微软试水信息检索[N];经济日报;2004年

2 叶静;开辟信息检索的新天地[N];人民邮电;2001年

3 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年

4 刘静一;个人档案信息检索[N];建筑报;2000年

5 刘光强;搜索个人、企业、垂直三大搜索新进展[N];中国计算机报;2007年

6 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年

7 刘立新;信息社会技术前瞻[N];学习时报;2006年

8 常燕杰;商用搜索 须打智慧牌[N];中国计算机报;2006年

9 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年

10 夏飞平 蒋光君;深圳局:信息检索实现“一点通”[N];中国国门时报;2009年

中国博士学位论文全文数据库 前10条

1 王彪;信息检索中信息需求域的研究[D];内蒙古大学;2012年

2 左家莉;信息检索中Markov网络图模型研究[D];江西财经大学;2011年

3 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年

4 董道国;高维数据索引结构研究[D];复旦大学;2005年

5 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年

6 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年

7 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年

8 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年

9 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年

10 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年

中国硕士学位论文全文数据库 前10条

1 徐海;基于Lucene垂直搜索引擎的研究与实现[D];西安科技大学;2009年

2 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年

3 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年

4 苏景春;基于Lucene的全文检索系统的研究与应用[D];北京交通大学;2010年

5 岳莉;基于Lucene的全文检索系统的研究与应用[D];西安电子科技大学;2010年

6 冯斌;基于Lucene小型搜索引擎的研究与实现[D];武汉理工大学;2008年

7 杨光伟;基于Lucene的个性化搜索引擎的研究与实现[D];内蒙古大学;2009年

8 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年

9 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年

10 杜先撰;基于Lucene全文索引系统设计与实现[D];南京大学;2011年



本文编号:687561

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/687561.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8529e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com