当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于用户行为分析的搜索引擎自动评价技术研究

发布时间:2016-06-15 05:45

  本文关键词:基于用户行为分析的搜索引擎自动评价技术研究,由笔耕文化传播整理发布。


《北京邮电大学》 2013年

基于用户行为分析的搜索引擎自动评价技术研究

余锦秀  

【摘要】:搜索引擎的出现彻底改变了人们获取信息的方式,它能够帮助用户快速且准确的从浩瀚的互联网海洋中获取全面的资料。如何对搜索引擎进行改进使其能更好的满足用户需求,一直以来都是信息检索领域的研究热点问题之一,而搜索引擎改进的核心问题就是搜索引擎的评价问题。 随着互联网信息的不断增多以及计算机技术的不断发展,传统的耗时耗力的手动评价方法已经不能满足实际需要了,提高搜索引擎评价方法的自动化势在必行。通过引入用户行为分析来实现评价的自动化是近年来的主要研究方向,此外,搜索引擎改进的终极目标也是为了更好的满足用户需要,所以了解用户在使用搜索引擎时的行为习惯以及对搜索引擎的看法对于改进搜索引擎评估都是至关重要的。因此我们发起了一项关于国内用户在使用搜索引擎时的行为习惯的调查问卷,通过分析返回结果数据,总结出了很多重要结论。 在调查结果的基础上,本文提出了一种基于用户行为分析的搜索引擎自动评价技术,构建了一个搜索引擎自动评价模型。该模型包括三个模块:首先从网络检索日志中自动提取查询词以及相关用户行为;然后用基于用户行为的方法对查询词进行标准答案自动标注;最后通过传统的检索结果评估机制,MAP (Mean Average Precision,平均准确率法)和NDCG (Normalize Discounted cumulative gain,归一化折扣增益法)比较了该方法获得的结果与标准答案结果的接近程度,其中标准答案通过人为标注获取。实验证明基于用户行为的评估方法比传统的基于点击率的方法具有更高的准确率。另外本文还将重复率的概念引入归一化折扣增益法NDCG,提出一种改进的搜索引擎检索结果质量评价机制。调查结果证明改进的机制可使得出的评测结果更加准确,并且具有更现实的意义。

【关键词】:
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前7条

1 石艳霞;信息检索中“相关性”与“相关反馈”研究概述[J];晋图学刊;2002年02期

2 陈艳;廖文杰;;基于信息技术接受模型的搜索引擎评价体系探讨[J];江西图书馆学刊;2008年01期

3 程学旗;郭嘉丰;靳小龙;;网络信息的检索与挖掘回顾[J];中文信息学报;2011年06期

4 钱喻锷;浅谈Internet上中文信息的搜索[J];思茅师范高等专科学校学报;2003年03期

5 李雪冰;;网络环境下的信息加工与查准率和查全率[J];中国西部科技(学术);2007年11期

6 黄凯宁;;基于层次分析的搜索引擎性能综合评价[J];现代计算机(专业版);2008年11期

7 梁延华,王振兴;Web搜索引擎评估技术研究[J];信息工程大学学报;2004年01期

中国硕士学位论文全文数据库 前1条

1 王放;一种自治的分布式信息采集与检索系统[D];四川大学;2006年

【共引文献】

中国期刊全文数据库 前10条

1 朱旭娟,李晓华,沈兰荪;一种自适应提取最优特征维的相关反馈算法[J];电路与系统学报;2004年01期

2 向俊;王静;何一辉;;远程教学资源整合及检索系统研究[J];广西广播电视大学学报;2012年03期

3 徐建民;朱松;陈富节;;术语相似度和术语相关度在检索模型中的融合研究[J];计算机应用;2007年12期

4 钱程;阳小兰;;一种支持Ajax框架的网络爬虫的设计与实现[J];计算机与数字工程;2012年04期

5 王元卓;靳小龙;程学旗;;网络大数据:现状与展望[J];计算机学报;2013年06期

6 莫祖英;;信息检索中的相关性[J];情报探索;2006年12期

7 孙鑫;信息检索中相关性反馈用法研究[J];情报杂志;2005年03期

8 谢大吉;;网络化制造资源主题搜索MRS系统的设计研究[J];计算机工程与设计;2011年09期

9 夏文秀;随书光盘的上网管理及应用实践[J];图书馆学刊;2005年02期

10 张国海;马晓英;闫立光;;基于熵权的搜索引擎评价指标体系的构建[J];图书情报工作;2010年12期

中国博士学位论文全文数据库 前1条

1 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

中国硕士学位论文全文数据库 前10条

1 李金涛;用户的思维能力对文献数据库检索中反馈调整的影响研究[D];西南大学;2011年

2 孙洁;3G业务使用影响因素的实证研究[D];南京大学;2011年

3 周黛;工程新闻信息的规模化采集及质量控制[D];华中科技大学;2010年

4 胡阳;中文搜索引擎用户检索习惯问卷调查分析[D];河北大学;2011年

5 王东涵;熵的思想在搜索引擎质量评价中的应用[D];上海交通大学;2012年

6 朱旭娟;一种基于内容的压缩域图像检索系统的开发[D];北京工业大学;2004年

7 殷亚玲;基于概念图的相关反馈系统的研究与实现[D];西北大学;2006年

8 张学军;一种基于空间特征的图象检索方法研究[D];辽宁工程技术大学;2006年

9 蒋明亮;基于CSCW的信息检索技术应用研究[D];广东工业大学;2007年

10 朱松;术语相似度和术语相关度的融合研究及应用[D];河北大学;2008年

【二级参考文献】

中国期刊全文数据库 前10条

1 刘朝阳;自主计算:下一代网络的帝国构想[J];互联网周刊;2001年26期

2 刘朝阳;“电子蜥蜴”迈出自主计算第二步(上)[J];互联网周刊;2001年32期

3 董晓常;Web2.0互联网再次喧嚣[J];互联网周刊;2005年24期

4 魏英,林怀忠,陈纯;RSS标准在Internet环境下新闻发布系统中的应用研究[J];计算机工程与应用;2005年15期

5 欧阳柳波,李学勇,李国徽,王鑫;专业搜索引擎搜索策略综述[J];计算机工程;2004年13期

6 吴刚,王怀民,毛新军;可成长的分布式系统[J];计算机工程与科学;2005年03期

7 鲁耀斌,徐红梅;技术接受模型及其相关理论的比较研究[J];科技进步与对策;2005年10期

8 王林;搜索引擎的原理和发展[J];图书馆理论与实践;2004年04期

9 李东旻;网站综合评价指标初探[J];情报理论与实践;2005年03期

10 冯项云;检索系统中的相关反馈机制[J];情报理论与实践;1998年06期

中国重要会议论文全文数据库 前1条

1 吴佳金;杨志豪;林原;林鸿飞;;基于改进Pairwise损失函数的排序学习方法[A];第六届全国信息检索学术会议论文集[C];2010年

【相似文献】

中国期刊全文数据库 前10条

1 顾珺;;基于Nutch的用户行为分析搜索引擎的实现[J];科技资讯;2009年15期

2 龚俊;;基于用户行为分析的个性化搜索引擎的构思[J];宁波大红鹰学院学报;2010年03期

3 郑双阳;林锦贤;;基于用户行为聚类的搜索[J];计算机与数字工程;2009年12期

4 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期

5 ;关键词搜索[J];每周电脑报;2000年38期

6 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期

7 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期

8 周毅华;从搜索引擎的分类看其应用技巧[J];图书馆理论与实践;2002年06期

9 邹小筑;搜索引擎的选择与使用技巧[J];图书馆学研究;2002年05期

10 林燕;Google搜索引擎的搜索功能与使用技巧[J];河北科技图苑;2003年05期

中国重要会议论文全文数据库 前10条

1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

2 陈磊;茹立云;马少平;;基于用户日志挖掘的搜索引擎广告效果分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

4 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年

5 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

6 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

7 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的网络搜索引擎用户行为研究[A];第三届学生计算语言学研讨会论文集[C];2006年

8 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

9 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

10 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

中国重要报纸全文数据库 前10条

1 李一鑫;[N];财经时报;2007年

2 周文林;[N];经济参考报;2007年

3 惠正一;[N];第一财经日报;2005年

4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;[N];中国计算机报;2005年

5 陈珊;[N];人民邮电;2005年

6 赵法忠;[N];中国经营报;2005年

7 金朝力;[N];北京商报;2006年

8 本报记者  赵晓辉 孟昭丽;[N];中国证券报;2006年

9 孙琎;[N];第一财经日报;2006年

10 姜蕊;[N];中国高新技术产业导报;2006年

中国博士学位论文全文数据库 前10条

1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

7 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

9 郑文良;基于简单本体的农业P2P搜索引擎关键技术研究[D];沈阳农业大学;2013年

10 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

中国硕士学位论文全文数据库 前10条

1 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

2 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年

3 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

4 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年

5 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年

6 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年

7 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年

8 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年

9 田生伟;基于涉农词典的搜索引擎的研究与实践[D];新疆大学;2004年

10 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年


  本文关键词:基于用户行为分析的搜索引擎自动评价技术研究,,由笔耕文化传播整理发布。



本文编号:57373

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/57373.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户50bad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com