当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于搜索引擎的相似度研究与应用

发布时间:2017-08-22 07:43

  本文关键词:基于搜索引擎的相似度研究与应用


  更多相关文章: 搜索引擎 相似度 集合论 市场份额


【摘要】:搜索引擎是现代社会不可或缺的最重要互联网应用之一,对其关注的重点也从商业领域逐步转移到科研领域。针对现今相似度计算方法不能全面反映对象间的关联性的局限,提出了一种基于搜索引擎的相似度计算方法。在搜索引擎结果数目的基础上,借鉴集合论的思想,通过引入搜索引擎市场份额及一系列的简化等数学方法,融合多个搜索引擎结果,最终得到相似度。实验结果证实了所提出的相似度计算方法的可行性与有效性。
【作者单位】: 西南交通大学信息科学与技术学院;
【关键词】搜索引擎 相似度 集合论 市场份额
【基金】:国家自然基金项目(61175047,61262058,61152001) 中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)资助
【分类号】:TP391.3
【正文快照】: 1引言作为最重要的互联网应用之一,搜索引擎是时代的产物,它的出现部分解决了互联网上信息泛滥所导致的信息检索困难问题。搜索引擎的类别也由传统的搜索引擎逐渐衍生出元搜索引擎、垂直搜索引擎、语义搜索引擎及智能搜索引擎等。近年来,以WalformAlpha、Freebase及DBpedia[1]

【参考文献】

中国期刊全文数据库 前10条

1 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期

2 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期

3 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期

4 彭波,闫宏飞;搜索引擎检索系统质量评估[J];计算机研究与发展;2005年10期

5 张培颖;;多特征融合的语句相似度计算模型[J];计算机工程与应用;2010年26期

6 连宇;彭进业;谢红梅;冯晓毅;;基于Google与KL距离的概念相关度算法[J];计算机工程;2011年19期

7 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期

8 张玉芳;艾东梅;黄涛;熊忠阳;;结合编辑距离和Google距离的语义标注方法[J];计算机应用研究;2010年02期

9 王荣波,池哲儒;基于词类串的汉语句子结构相似度计算方法[J];中文信息学报;2005年01期

10 李峰;李芳;;中文词语语义相似度计算——基于《知网》2000[J];中文信息学报;2007年03期

【共引文献】

中国期刊全文数据库 前10条

1 刘高军;马砚忠;段建勇;;基于维基百科的中文命名实体关联度计算[J];北方工业大学学报;2012年01期

2 陈康;樊孝忠;刘杰;贾可亮;;基于问句语义表征的中文问句相似度计算方法[J];北京理工大学学报;2007年12期

3 官连军;丁光耀;张燕妮;;支持多种模糊处理的英文智能预提示输入引擎[J];成都信息工程学院学报;2012年02期

4 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期

5 张燕;宋锦斌;;卡通动画数字媒体资源管理系统[J];长沙医学院学报;2010年02期

6 李旭;赵亚伟;刘国华;;基于指纹和语义特征的文档复制检测方法[J];燕山大学学报;2008年04期

7 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期

8 林鸿飞;丁洪文;杨志豪;赵晶;;基于概念和统计的问答系统实现机制[J];大连理工大学学报;2006年02期

9 柴晓丽;张丽伟;管玉玲;;基于HowNet自动文摘的研究[J];电脑编程技巧与维护;2009年S1期

10 穆炜炜;王国才;;主观题自动评阅算法设计[J];电脑知识与技术;2012年15期

中国重要会议论文全文数据库 前10条

1 李红霞;袁晓芳;田水承;王莉;;基于义类词典的煤矿瓦斯爆炸案例推理系统研究[A];中国职业安全健康协会2008年学术年会论文集[C];2008年

2 邓辉;林柏钢;;一种基于《知网》的敏感信息预测技术[A];第十届中国科协年会论文集(三)[C];2008年

3 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年

4 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

5 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

6 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

7 刘宝艳;林鸿飞;杨志豪;;基于改进编辑距离和依存结构的句子相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年

8 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

9 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

10 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年

中国博士学位论文全文数据库 前10条

1 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年

2 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年

3 李剑;PSTN话带数据分离与调制识别[D];解放军信息工程大学;2009年

4 赵威;电网数据中心的数据安全问题研究[D];燕山大学;2011年

5 邵世维;基于几何特征的多尺度矢量面状实体匹配方法研究与应用[D];武汉大学;2011年

6 单建芳;面向事件的文本表示研究[D];上海大学;2012年

7 彭强;复杂系统远程智能故障诊断技术研究[D];南京理工大学;2004年

8 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年

9 谢能付;基于语义Web技术的知识融合和同步方法研究[D];中国科学院研究生院(计算技术研究所);2006年

10 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年

中国硕士学位论文全文数据库 前10条

1 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年

2 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年

3 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年

4 王森;基于主题树的自上而下文本复制检测研究[D];大连理工大学;2010年

5 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年

6 朴红吉;基于分布式多索引融合的专利信息检索研究[D];大连理工大学;2010年

7 徐美霞;基于web技术的网上考试系统[D];中国海洋大学;2010年

8 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年

9 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年

10 樊春雷;基于语义分析的糖尿病健康教育系统研究与实现[D];华东理工大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 李红梅;丁振国;周水生;周利华;;元搜索引擎结果合成算法[J];北京邮电大学学报;2008年05期

2 赵蔚;刘秀琴;邱百爽;;语义网自适应学习系统中领域本体的构建[J];吉林大学学报(信息科学版);2008年05期

3 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期

4 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期

5 朱靖波,王宝库,姚天顺;一种规则描述语言NPRDL语言[J];东北大学学报;1996年06期

6 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期

7 吴素研;郭巧;;语义网中基于Kullback-Leibler距离的本体映射方法(英文)[J];Journal of Southeast University(English Edition);2007年03期

8 程涛;施水才;王霞;吕学强;;基于同义词词林的中文文本主题词提取[J];广西师范大学学报(自然科学版);2007年02期

9 秦兵;刘挺;王洋;郑实福;李生;;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期

10 朱礼军,陶兰,刘慧;领域本体中的概念相似度计算[J];华南理工大学学报(自然科学版);2004年S1期

中国重要会议论文全文数据库 前3条

1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

2 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

3 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

中国博士学位论文全文数据库 前2条

1 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年

2 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年

【相似文献】

中国期刊全文数据库 前10条

1 陈沈焰;吴军华;;基于本体的概念语义相似度计算及其应用[J];微电子学与计算机;2008年12期

2 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期

3 ;关键词搜索[J];每周电脑报;2000年38期

4 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期

5 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期

6 周毅华;从搜索引擎的分类看其应用技巧[J];图书馆理论与实践;2002年06期

7 邹小筑;搜索引擎的选择与使用技巧[J];图书馆学研究;2002年05期

8 林燕;Google搜索引擎的搜索功能与使用技巧[J];河北科技图苑;2003年05期

9 林中;GOOGLE搜索引擎的关键词检索[J];中国信息导报;2003年03期

10 封剑待封喉;吸星大法“搜”天下 笑傲网络任我行——搜索引擎绝对专题[J];网络与信息;2003年07期

中国重要会议论文全文数据库 前10条

1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

2 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

7 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

8 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

9 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年

10 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年

中国重要报纸全文数据库 前10条

1 李一鑫;搜索排名的红与黑[N];财经时报;2007年

2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年

3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年

4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年

5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年

6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年

7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年

8 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年

9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年

10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年

中国博士学位论文全文数据库 前10条

1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

7 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

9 郑文良;基于简单本体的农业P2P搜索引擎关键技术研究[D];沈阳农业大学;2013年

10 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

中国硕士学位论文全文数据库 前10条

1 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

2 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年

3 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

4 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年

5 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年

6 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年

7 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年

8 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年

9 田生伟;基于涉农词典的搜索引擎的研究与实践[D];新疆大学;2004年

10 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年



本文编号:717922

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/717922.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c385f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com