当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于用户标记的社会化搜索引擎的设计与研究

发布时间:2016-11-01 12:46

  本文关键词:基于用户标记的社会化搜索引擎的设计与研究,由笔耕文化传播整理发布。


《北京工业大学》 2012年

基于用户标记的社会化搜索引擎的设计与研究

李京生  

【摘要】:在互联网技术飞速发展的今天,搜索引擎已经成为人们生活中必不可少的一部分。各式搜索引擎已经成为在信息过载的互联网中搜寻信息的有利工具。但是,搜索引擎的表现并不总是尽如人意。很多时候,当用户输入一个查询词,搜索引擎会返回成千上万的搜索结果,而其中只有很少一部分甚至没有网页是符合用户需求的。如何理解用户的搜索意图,找出符合用户需求的网页,并将最相关的网页置于搜索结果的前列,这成为众多学者研究的重要课题。社会化搜索就是在这样的大环境中走上前台的,它主要是借助用户的反馈信息对搜索结果筛选和整理,也就是强调人的智慧及参与,不再单纯依靠机器算法的直接判定。 社会化搜索引擎的研究在业界一直没有定论,本文从社会化搜索引擎的基本原型出发,对国内外有关研究做了全面对比分析。同时对用户常见的反馈方式进行了阐述,,从最符合用户操作习惯的角度出发,结合当今web2.0时代最流行的社会化标签,设计了一种崭新的搜索结果标签云展示形式。用户通过对搜索结果标签的权重进行更新操作,给搜索引擎反馈信息。 通过研究用户点击标签的反馈形式,提出了用户反馈分值的概念,对用户反馈影响搜索结果排名的具体方法以及相应实现进行研究,并提出了一种基于用户反馈的网页排序算法。该算法结合Lucene开源检索系统原有算法,在接受用户反馈之后对结果进行二次排序,使最终的排序结果更接近用户的真实需求。 最后,对基于用户反馈排序算法的社会化搜索引擎进行实验,对实验前后结果进行对比分析,结果表明用户的浏览和检索的质量和效率都有较大的提升。

【关键词】:
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前10条

1 ;CNNIC发布第21次中国互联网络发展状况统计报告[J];电子政务;2008年Z1期

2 张卫丰,徐宝文;Web搜索引擎框架研究[J];计算机研究与发展;2000年03期

3 刘小珠;彭智勇;陈旭;;高效的随机访问分块倒排文件自索引技术[J];计算机学报;2010年06期

4 文立;石跃祥;莫浩澜;;一种新的动态权重更新相关反馈方法[J];计算机应用研究;2007年08期

5 原福永,褚蓓蓓;一种基于超链接结构的向量空间模型改进算法[J];中文信息学报;2005年04期

6 陈玉;;Web2.0环境下的社会化搜索研究[J];情报探索;2010年09期

7 宋立荣;张薇;杨晶;;基于信息共享背景下的数据和信息之概念辨析[J];情报杂志;2012年01期

8 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期

9 窦永香;苏山佳;赵捧未;;信息检索研究的发展与动向——对ACM SIGIR信息检索年会的主题分析[J];情报理论与实践;2010年07期

10 孙茜;;Web2.0的含义、特征与应用研究[J];现代情报;2006年02期

中国硕士学位论文全文数据库 前3条

1 孙启明;基于Web日志挖掘的搜索引擎排序算法的改进[D];哈尔滨工程大学;2007年

2 陈琛;基于社会化标签的个性化搜索研究[D];扬州大学;2008年

3 李姗姗;基于“使用与满足”理论的虚拟社区网民行为研究[D];华南理工大学;2010年

【共引文献】

中国期刊全文数据库 前10条

1 李广水;宋丁全;;数据分析在森林资源调查中的应用及发展研究[J];安徽农业科学;2009年22期

2 宋伟;程兆齐;;挑战与变革——Web2.0的版权问题探析[J];安徽商贸职业技术学院学报(社会科学版);2007年02期

3 沈思;;Web网络模型演化下的信息技术[J];信息安全与技术;2011年12期

4 左国才;周荣华;符开耀;;基于DBSCAN算法的电信客户分类的应用研究[J];北京联合大学学报(自然科学版);2012年03期

5 李晓方;武仲科;樊亚春;周明全;柳勇光;;一种新的用于三维检索的快速邻域搜索方法[J];北京师范大学学报(自然科学版);2011年05期

6 章林柯;崔立林;;潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J];船舶力学;2011年08期

7 孙英娟;杨柳;何昆鸟;;属性离散化算法研究[J];长春师范学院学报(人文社会科学版);2009年12期

8 崔英志;张绪玉;高博;;Web2.0时代的网站架构[J];重庆工学院学报(自然科学版);2008年05期

9 高博;周旖;崔英志;;Web2.0网站的特点与社区化模式[J];重庆工学院学报(自然科学版);2009年06期

10 陈庆枝;陈国龙;郭文忠;陈仕涛;;信息安全评估日志数据的一种混合聚类算法[J];重庆工学院学报(自然科学版);2009年10期

中国重要会议论文全文数据库 前10条

1 曾成;赵锡均;徐红;;基于量子遗传算法的聚类方法[A];第二十九届中国控制会议论文集[C];2010年

2 沈锡宾;杨先海;吴国仕;;基于Web 2.0技术的公开评议开放存取期刊管理系统的分析与设计[A];第七届中国科技期刊发展论坛论文集[C];2011年

3 ;A Fuzzy Neural Network System Modeling Method Based on Data-driven[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

4 刘保政;汪定伟;;基于多因素的相近距离聚类方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

5 张立涛;张宇峰;;基于聚类分析的大型桥梁结构健康监测数据异常识别研究[A];第21届全国结构工程学术会议论文集第Ⅱ册[C];2012年

6 杨雪雁;;基于Web2.0的企业网络营销推广模型研究[A];信息经济学与电子商务:第十三届中国信息经济学会学术年会论文集[C];2008年

7 赵璐;;Web2.0对医学信息服务创新的启示和思考[A];公共文化服务与图书馆实践的创新——浙江省图书馆学会第十次学术研讨会论文集[C];2006年

8 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年

9 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年

10 朴星海;赵铁军;郑德权;张迪;;面向Blog的网络爬行器设计与实现[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

中国博士学位论文全文数据库 前10条

1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年

2 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年

3 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年

4 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年

5 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年

6 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年

7 卓莹;基于拓扑·流量挖掘的网络态势感知技术研究[D];国防科学技术大学;2010年

8 陈彬;面向DEVS的多范式建模与仿真关键技术研究与实现[D];国防科学技术大学;2010年

9 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年

10 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

中国硕士学位论文全文数据库 前10条

1 朱静;数据资源汇聚中嵌套表格模型的研究与应用[D];山东科技大学;2010年

2 林瑞锋;互联网服务社区中服务资源的调用技术研究[D];山东科技大学;2010年

3 刘文昊;基于模糊聚类和纹版辅助的织物疵点检测算法研究[D];浙江理工大学;2010年

4 李振;网络舆情预测关键技术研究[D];郑州大学;2010年

5 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年

6 刘萍;软件体系结构恢复的研究与实现[D];大连理工大学;2010年

7 刘晓飞;基于相关反馈的图像检索研究[D];大连理工大学;2010年

8 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年

9 李丹丹;基于权重设计的聚类融合算法研究及应用[D];辽宁工程技术大学;2009年

10 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年

【二级参考文献】

中国期刊全文数据库 前10条

1 邓泽球,张桂群;论网络虚拟人格[J];常德师范学院学报(社会科学版);2002年02期

2 邓汉慧,张子刚;西蒙的有限理性研究综述[J];中国地质大学学报(社会科学版);2004年06期

3 王玉珍;Web使用模式挖掘中的几个关键问题研究[J];电脑开发与应用;2003年11期

4 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期

5 杨宜音;陈午晴;徐冰;;中国网民社会心理分析——第一份来自社会心理学家的专业研究报告[J];Internet信息世界;2000年04期

6 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期

7 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期

8 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期

9 李凯,赫枫龄,左万利;PageRank-Pro——一种改进的网页排序算法[J];吉林大学学报(理学版);2003年02期

10 涂承胜,鲁明羽,陆玉昌;Web挖掘研究综述[J];计算机工程与应用;2003年10期

中国博士学位论文全文数据库 前3条

1 杨从科;中国农业科学数据资源建设研究[D];中国农业科学院;2007年

2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年

3 宋立荣;基于网络共享的农业科技信息质量管理研究[D];中国农业科学院;2008年

中国硕士学位论文全文数据库 前3条

1 熊霞;数据仓库中数据质量控制问题研究[D];武汉大学;2004年

2 张芳;政府统计数据质量及其管理研究[D];湖南大学;2004年

3 赵中宁;社会化搜索模式的理论与实践研究[D];清华大学;2006年

【相似文献】

中国期刊全文数据库 前10条

1 黄奇,邵波,袁勤俭;基于Web信息的可利用性[J];情报杂志;2000年02期

2 栾振华;网络资源搜寻技巧点滴[J];数码世界;2003年04期

3 那罡;;移动搜索的“简单”逻辑[J];中国计算机用户;2006年26期

4 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期

5 黄晓冬;Invisible Web研究综述[J];情报科学;2004年09期

6 ;天下[J];中国计算机用户;2009年08期

7 杨丽杰;搜索引擎的原理与利用研究[J];现代情报;2004年02期

8 于国富;;小心!搜索引擎惹麻烦[J];电脑爱好者;2006年13期

9 蔡建超;郭一平;王亮;;基于Lucene.Net校园网搜索引擎的设计与实现[J];计算机技术与发展;2006年11期

10 傅欣;第三代搜索引擎的智能化趋势研究[J];现代图书情报技术;2002年06期

中国重要会议论文全文数据库 前10条

1 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

5 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

9 石淑华;;利用搜索引擎检索网络生物信息的方法与技巧[A];山西省科学技术情报学会学术年会论文集[C];2004年

10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年

中国重要报纸全文数据库 前10条

1 刘文君;[N];大众科技报;2007年

2 姜蕊;[N];中国高新技术产业导报;2006年

3 元元;[N];证券日报;2006年

4 郑杏果;[N];中国计算机报;2007年

5 ;[N];计算机世界;2008年

6 本报记者 符王润 通讯员 湛立;[N];广东科技报;2009年

7 本报记者 胡钰;[N];华夏时报;2008年

8 周广奋;[N];中国国门时报;2007年

9 本报记者 刘菁菁;[N];计算机世界;2011年

10 姜蕊;[N];国际商报;2006年

中国博士学位论文全文数据库 前10条

1 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

3 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

4 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

7 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

10 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年

中国硕士学位论文全文数据库 前10条

1 金祖旭;基于用户反馈的搜索引擎排名算法研究[D];复旦大学;2010年

2 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年

3 时延军;基于Nutch的分布式搜索引擎的设计与研究[D];长春理工大学;2010年

4 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年

5 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

6 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年

7 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

8 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年

9 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年

10 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年


  本文关键词:基于用户标记的社会化搜索引擎的设计与研究,由笔耕文化传播整理发布。



本文编号:160910

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/160910.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户062da***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com