当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于用户兴趣模型的个性化信息检索技术研究

发布时间:2017-08-07 08:31

  本文关键词:基于用户兴趣模型的个性化信息检索技术研究


  更多相关文章: 用户兴趣模型 个性化 搜索引擎


【摘要】:目前,网络上的信息以指数级的增长速度增加,而且一直处于不断地变化中,利用传统的仅仅依靠关键字匹配搜索引擎技术,用户难以快速准确地找到自己真正感兴趣的信息。基于用户兴趣的个性化搜索技术成为了研究热点。本文针对传统信息检索技术存在的问题,对基于用户兴趣模型的个性化信息检索技术展开研究,主要研究内容如下:(1)深入研究了搜索引擎、个性化信息检索以及用户兴趣建模相关理论与技术,对比传统信息检索,设计了基于用户兴趣模型的个性化信息检索系统,给出系统的框架和实现过程。(2)构建用户兴趣模型并提出一种用户兴趣模型更新方法。将用户浏览历史网页、收藏夹中的网页进行预处理,使用TF-IDF算法计算关键词及其权重,从所有关键词中按照权重值的大小选取出前N个,构建用户初始兴趣模型。然后对初始模型使用遗忘因子进行遗忘,并根据用户的浏览网页行为计算用户的网页兴趣度,将网页兴趣度较大的网页进行存储,并对其进行进一步处理,提取出新的兴趣向量,将新的兴趣向量同初始建立的用户兴趣模型比较,来优化更新兴趣模型。(3)计算返回结果同用户兴趣模型的相似度。将初始返回的结果文档同用户兴趣模型使用余弦相似度算法进行相似度计算,将返回结果按照相似度大小进行重新排序。(4)采用Java语言在Lucene开源框架的基础上构建了个性化信息检索原型系统,通过爬虫来提取网页信息,然后构建索引及实现查询,最后将检索结果同用户兴趣模型进行相似度计算,按照相似度大小重新排序,将与用户兴趣相关的结果排在靠前的位置,通过实验验证了此种方法的可行性,能够提高检索系统的性能以及用户使用的满意度。
【关键词】:用户兴趣模型 个性化 搜索引擎
【学位授予单位】:石家庄铁道大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 第一章 绪论9-16
  • 1.1 课题研究背景及意义9-10
  • 1.2 个性化服务的研究现状10-11
  • 1.3 用户兴趣建模的研究现状11-14
  • 1.4 主要研究内容14
  • 1.5 论文的组织结构14-16
  • 第二章 搜索引擎技术研究16-30
  • 2.1 搜索引擎16-18
  • 2.1.1 搜索引擎的概念16
  • 2.1.2 搜索引擎的工作原理16-18
  • 2.2 个性化搜索引擎18-20
  • 2.2.1 个性化搜索引擎的概念18-19
  • 2.2.2 个性化搜索引擎的工作原理19-20
  • 2.3 Lucene简介20-22
  • 2.3.1 Lucene的优点20-21
  • 2.3.2 Lucene的系统结构分析21-22
  • 2.4 用户兴趣模型22-28
  • 2.4.1 用户数据获取22-25
  • 2.4.2 建模技术25-26
  • 2.4.3 用户兴趣模型的表示26-28
  • 2.5 文档相似度计算28-29
  • 2.6 本章小结29-30
  • 第三章 用户兴趣模型的构建30-47
  • 3.1 用户兴趣模型概述30
  • 3.2 用户兴趣模型设计思想30-31
  • 3.3 初始兴趣模型的建立31-37
  • 3.3.1 设计流程31
  • 3.3.2 用户兴趣网页URL提取31-33
  • 3.3.3 预处理33-34
  • 3.3.4 特征项选择及权重计算34-36
  • 3.3.5 初始兴趣模型建立算法描述36-37
  • 3.4 模型的动态优化与更新37-45
  • 3.4.1 网页兴趣度38
  • 3.4.2 用户行为概述38-39
  • 3.4.3 用户兴趣度计算39-40
  • 3.4.4 用户兴趣度阈值选择的实验40-42
  • 3.4.5 模型优化更新算法42-43
  • 3.4.6 模型优化更新算法描述43-45
  • 3.5 用户兴趣模型建立过程小结45-46
  • 3.6 本章小结46-47
  • 第四章 个性化检索系统原型的设计与实现47-69
  • 4.1 实验环境47
  • 4.2 Web服务器Tomcat47-48
  • 4.3 系统设计思想48
  • 4.4 系统架构48-64
  • 4.4.1 搜集49-54
  • 4.4.2 索引54-57
  • 4.4.3 查询57-58
  • 4.4.4 用户兴趣模型建立模块58-62
  • 4.4.5 相似度计算模块62-63
  • 4.4.6 用户接.模块63-64
  • 4.5 系统实现64-66
  • 4.6 实验分析66-68
  • 4.6.1 排列位置比较66-67
  • 4.6.2 查准率比较67-68
  • 4.7 本章小结68-69
  • 第五章 总结与展望69-71
  • 参考文献71-76
  • 致谢76-77
  • 个人简历、在学期间的研究成果及发表的学术论文77

【相似文献】

中国期刊全文数据库 前10条

1 孙铁利,杨凤芹;根据用户隐式反馈建立和更新用户兴趣模型[J];东北师大学报(自然科学版);2003年03期

2 邵志峰;李荣陆;胡运发;;基于中图分类法的用户兴趣模型研究[J];计算机应用与软件;2007年08期

3 李峰;裴军;游之洋;;基于隐式反馈的自适应用户兴趣模型[J];计算机工程与应用;2008年09期

4 李玉霞;;教学兴趣模型与信息伦理教育的融合[J];中国科技信息;2010年24期

5 杨树林;田卫东;;基于农业本体的用户兴趣模型研究[J];电脑知识与技术;2011年13期

6 刘霄宇;;用户兴趣模型的构建方法[J];现代商业;2013年23期

7 朱强;;基于网络信息提取系统中用户兴趣模型建立的研究[J];科技致富向导;2013年11期

8 刘晋;王潜平;;个性化服务中用户兴趣模型相关技术的研究[J];电脑知识与技术(学术交流);2007年10期

9 曾义聪;;基于兴趣模型的主题搜索机器人技术探讨[J];科技信息(学术研究);2008年24期

10 蒲国林;杨清平;王刚;邱玉辉;;基于语义的个性化用户兴趣模型[J];计算机科学;2008年07期

中国重要会议论文全文数据库 前8条

1 吴晓;李丹宁;林洁;冀肖榆;李丹;;个性化搜索引擎中用户兴趣模型的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

2 徐志明;宋毅;冯子威;李生;;一种基于分类的用户兴趣模型[A];第六届全国信息检索学术会议论文集[C];2010年

3 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年

4 周延泉;张传福;张瑞华;李蕾;何华灿;;移动个性化信息服务中的用户兴趣模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

5 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

6 张艳;章勇;;基于RSS信息服务的自适应用户兴趣模型研究[A];第七届中国通信学会学术年会论文集[C];2010年

7 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年

8 余珊珊;吴京慧;;个性化搜索引擎中用户兴趣模型的研究和设计[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

中国硕士学位论文全文数据库 前10条

1 袁博阳;基于微博内容和用户关注的微博用户兴趣模型构建[D];华南理工大学;2015年

2 赵雪美;基于用户兴趣模型的个性化推荐算法研究[D];南京理工大学;2015年

3 徐晓彤;微博用户兴趣模型及个性化推荐技术研究与应用[D];大连海事大学;2015年

4 宋章浩;基于Web浏览行为的用户兴趣模型研究[D];西南科技大学;2015年

5 夏春燕;适用于文本信息推荐的用户兴趣模型构建与更新方法[D];电子科技大学;2014年

6 王孟;基于教育云平台的个性化推荐系统设计与实现[D];电子科技大学;2014年

7 司书勇;基于用户兴趣模型的精准信息推荐技术研究与实现[D];北京工业大学;2015年

8 李杏艳;基于用户兴趣模型的个性化信息检索技术研究[D];石家庄铁道大学;2015年

9 李伟;基于用户兴趣模型的新闻自动推荐系统[D];复旦大学;2009年

10 杨凤芹;建立层次结构用户兴趣模型的方法[D];东北师范大学;2004年



本文编号:633738

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/633738.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77515***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com