当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于多本体的智能搜索引擎模型研究与实现

发布时间:2016-06-25 11:03

  本文关键词:基于多本体的智能搜索引擎模型研究与实现,由笔耕文化传播整理发布。


《首都师范大学》 2013年

基于多本体的智能搜索引擎模型研究与实现

张灿  

【摘要】:随着近些年来互联网的迅猛发展,网络数据量呈指数级的增长,用户对搜索的需求越来越多迫切。如何在海量的网页数据中准确、迅速找到用户期望的结果,越来越成为搜索引擎领域热点问题。传统的基于关键字匹配的搜索引擎技术显然已经不能够满足广大互联网需求。随着语义网技术的发展,本体技术进入人们的视野,基于本体的搜索引擎技术越来越受到重视。经过这些年来的探索发展,基于单个领域本体的搜索引擎技术已有所进展。然后,在现在互联网走向个性化、社区化的趋势中,单个网页资源中包含的概念不仅限于一个领域中,很可能是跨领域的概念实体出现在同一个网页资源中。所以,我们需要多领域本体支持的搜索引擎技术来应对这一趋势。 本文主要讨论基于多领域本体支持的搜索引擎技术的框架设计及相关技术。首先,结合当前搜索引擎发展状况,讨论了搜索引擎技术的核心问题评价标准,并在此基础上分析了搜索引擎未来的八大发展趋势。然后,分析和比较了现有的语义标注工具和方法,阐述了一般的语义标注流程,给出了一种基于多本体支持的语义标注工具模型设计框图。最后,结合语义标注技术及传统的搜索引擎的模型给出了一种基于多本体支持的搜索引擎框架。通过实验系统的检验,并分析了结果。 该框架分为领域信息的采集、网页资源的预处理、元数据抽取、元数据索引、查询扩展及查询重排六个模块。其中,领域信息采集模块,在传统的信息采集系统的基础上,提出了一种动态判定网页是否属于特定领域的采集策略;预处理模块主要是实现了网页去噪、去重等操作,重点讨论了网页去重算法;元数据抽取模块,提出了一种基于XSLT技术的HTML等结构化文档的元数据抽取策略;元数据索引利用倒排索引的技术将抽取到的元数据文档进行索引,为检索操作打下基础;查询扩展通过对查询请求进行语法、语义两方面的推理扩展;查询重排,在Lucene开源框架下,综合链接评价、文档综合评分基础上增加了文档与领域本体的匹配程度三方面因素,提高检索的查准率。经过试验系统的试验检测,该模型在查全率和查准率方面优于传统基于关键字检索模型。

【关键词】:
【学位授予单位】:首都师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前2条

1 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期

2 刘治纲;叶水生;;基于多本体的搜索引擎框架设计[J];南昌航空大学学报(自然科学版);2011年02期

中国硕士学位论文全文数据库 前2条

1 沙丽华;面向领域文档的语义标注方法研究[D];吉林大学;2009年

2 于晓繁;基于本体和元数据的语义标注平台模型与系统架构研究[D];山东理工大学;2012年

【共引文献】

中国期刊全文数据库 前10条

1 王晓东,高宏卿,张际平;基于Ontology疑难问题答疑系统的设计与实现[J];电化教育研究;2004年09期

2 袁亮环;;基于本体的智能参考咨询系统研究[J];电脑知识与技术;2010年16期

3 杨宁;郭雷;方俊;;基于语义的查询优化方法[J];纺织高校基础科学学报;2011年01期

4 杨晓东;林晓霞;崔孟荣;;基于本体的网络信息检索[J];福建电脑;2006年09期

5 魏桂英;高学东;武森;;基于领域本体的个性化文本信息检索[J];辽宁工程技术大学学报(自然科学版);2011年02期

6 罗清磊,章文,李卫华;基于本体的Web智能信息Agent[J];广东工业大学学报;2004年03期

7 张凤琴;;普适计算中基于本体的上下文感知研究[J];甘肃科技;2009年03期

8 程新荣;杨仁刚;康丽;;基于Ontology的Web信息检索方法[J];广西师范大学学报(自然科学版);2007年02期

9 林洁;;基于本体的个性化检索技术研究[J];贵州科学;2009年04期

10 马斌;;基于本体的管理信息系统课程知识表示方法研究[J];电脑开发与应用;2013年08期

中国重要会议论文全文数据库 前3条

1 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 孙涌;韦小丽;;领域本体构建研究及在专利信息服务中的应用[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

3 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

中国博士学位论文全文数据库 前10条

1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年

2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年

3 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年

4 汤华茂;基于语义的产业链网络化协同设计模式及关键技术研究[D];重庆大学;2010年

5 马沁怡;基于KBE的快速有限元分析方法研究[D];大连理工大学;2011年

6 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年

7 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年

8 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年

9 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年

10 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年

中国硕士学位论文全文数据库 前10条

1 朱利君;基于茶学领域本体的智能检索研究[D];安徽农业大学;2010年

2 王娟;基于本体的课程资源管理系统研究[D];江西师范大学;2010年

3 杜海波;本体在医疗信息检索系统中的应用研究[D];长春工业大学;2010年

4 李帅;基于语义相似度的查询扩展优化[D];杭州电子科技大学;2011年

5 宋庆;基于领域本体的智能检索技术应用研究[D];中国农业科学院;2011年

6 申欣;基于语义网的信息检索研究[D];山东理工大学;2011年

7 刘景波;基于本体的村镇空间规划信息搜索方法研究与实现[D];电子科技大学;2011年

8 张春节;基于规则的隐私本体推理研究[D];云南大学;2011年

9 王利甫;基于本体的语义检索在数字图书馆中的应用研究[D];郑州大学;2011年

10 焦莉;基于本体技术的积件式教学系统的研究与设计[D];江西师范大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 李向阳;张亚非;;一种基于遗传算法的语义标注[J];电子科技大学学报;2007年01期

3 傅赛香,袁鼎荣,黄柏雄,钟智;基于统计的无词典分词方法[J];广西科学院学报;2002年04期

4 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期

5 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期

6 高研博;赵京雷;陆汝占;;基于自动模板方法的汉语语义标注[J];计算机工程与应用;2008年07期

7 尹奇韡;李善平;;语义Web语言DAML+OIL及其应用初探[J];计算机科学;2003年01期

8 胡鹤,刘大有,王生生;Web本体语言OWL[J];计算机工程;2004年12期

9 潘宇斌,陈跃新;基于Ontology的自然语言理解[J];计算技术与自动化;2003年04期

10 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期

中国博士学位论文全文数据库 前1条

1 刘海学;基于语义标注的元数据自动构建及其相关技术研究[D];华东师范大学;2010年

中国硕士学位论文全文数据库 前4条

1 熊荣东;结合WordNet的领域语义标注研究[D];重庆大学;2011年

2 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年

3 毛平;基于领域本体的文本信息语义检索研究[D];南京理工大学;2007年

4 汤炜;基于OWL的语义检索系统的研究与应用[D];武汉理工大学;2009年

【相似文献】

中国期刊全文数据库 前10条

1 徐险峰;;网络信息检索搜索引擎技术及发展趋势[J];江西图书馆学刊;2005年04期

2 韩进军;安园园;;搜索引擎的未来发展[J];医学信息学杂志;2007年05期

3 刘冰;胡风华;;知识库系统在智能搜索引擎中的应用[J];光盘技术;2009年02期

4 康桂英,张帆,刘春平;新一代智能搜索引擎网典研究[J];情报理论与实践;2000年03期

5 袁渊;;搜索引擎关键技术及展望[J];湖北财经高等专科学校学报;2006年05期

6 刘志娟;;虚拟参考咨询与搜索引擎的结合——智能搜索引擎诞生[J];图书情报论坛;2008年03期

7 王挺;;智能搜索引擎在企业人力资源管理决策支持系统中的应用[J];电脑知识与技术;2010年24期

8 刘志娟;黄立冬;;虚拟参考咨询与搜索引擎结合——智能搜索引擎的诞生[J];科技情报开发与经济;2008年25期

9 胡风华;刘冰;;基于知识库系统的智能搜索引擎研究[J];电脑知识与技术;2009年11期

10 刘成亮;韩海伟;;知识库系统的原理及其在智能搜索引擎中的应用[J];电脑知识与技术;2008年08期

中国重要会议论文全文数据库 前10条

1 田田;马军;李跃军;;应用多本体进行信息检索的研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

2 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

3 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

4 王晓峰;刘惟一;;从用户需求到网页集团的模糊变换[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

5 吴倩;杨逍;张兆心;;基于视觉特征的网页信息提取[A];第六届全国信息检索学术会议论文集[C];2010年

6 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年

7 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 赵玉芳;张一鸣;;基于网页信息的印象形成的初步研究[A];第十届全国心理学学术大会论文摘要集[C];2005年

9 张阳;李战怀;近藤广幸;;WEB PAGE的自动分类[A];第十六届全国数据库学术会议论文集[C];1999年

10 冯玉才;胡刚;陈胜;蔡诏;向隆刚;李东;;大能量转换系统远程实时数据库设计与实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

中国重要报纸全文数据库 前10条

1 惠晓霜;[N];新华每日电讯;2009年

2 本报记者 蒋峥;[N];经济日报;2000年

3 王旭;[N];计算机世界;2001年

4 陆元婕;[N];中国计算机报;2001年

5 朱艳燕;[N];中华工商时报;2004年

6 壮壮;[N];电脑报;2004年

7 钱峻英;[N];光明日报;2004年

8 本报记者 张彤;[N];网络世界;2003年

9 王宏亮;[N];经济视点报;2005年

10 张秋;[N];中国邮政报;2004年

中国博士学位论文全文数据库 前10条

1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年

2 刘竟;面向概念检索的农史信息门户的设计与构建[D];南京农业大学;2008年

3 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年

4 焦斌星;用于搜索的网页可视化摘要技术研究[D];中国科学技术大学;2012年

5 米杨;基于顶级本体整合的医学领域语义标注研究[D];吉林大学;2012年

6 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年

7 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年

8 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

9 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年

10 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年

中国硕士学位论文全文数据库 前10条

1 张灿;基于多本体的智能搜索引擎模型研究与实现[D];首都师范大学;2013年

2 孟骁;基于语义网络的智能搜索引擎研究[D];东北师范大学;2011年

3 雷丰云;智能搜索引擎的理论分析与应用研究[D];中南大学;2007年

4 李振振;基于本体的智能搜索引擎研究与应用[D];青岛科技大学;2010年

5 张骞;传统搜索引擎与智能搜索引擎比较研究[D];郑州大学;2012年

6 杨延锟;面向油田信息服务的智能搜索引擎研究与应用[D];大庆石油学院;2010年

7 李娟;数据挖掘技术在智能搜索引擎中的应用[D];长春理工大学;2010年

8 朱素媛;网络教育中的智能搜索引擎的研究[D];合肥工业大学;2004年

9 张明远;基于粒计算的智能搜索引擎技术研究[D];武汉理工大学;2010年

10 于洪波;中文网页自动采集与分类系统设计与实现[D];北京邮电大学;2010年


  本文关键词:基于多本体的智能搜索引擎模型研究与实现,,由笔耕文化传播整理发布。



本文编号:61330

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/61330.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f0172***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com