当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于网页内容和时间反馈的网页排序PageRank算法研究

发布时间:2022-01-23 01:48
  随着互联网的飞速发展,搜索引擎已经成为人们获得信息的最重要手段之一。面对众多杂乱无章的网页信息,以及人们使用搜索引擎浏览网页信息时大多数只关注前几条或前几页的习惯,能否快速、准确地从互联网上获取有价值的信息是评价一个搜索引擎好坏的关键,返回的网页结果的先后顺序也变得尤为重要。因此,搜索引擎的网页排序算法也就成为人们关注的关键问题之一。本文主要是以搜索引擎的网页排序算法作为研究背景,分析现有的主流排序算法,深入剖析经典的基于链接分析的HITS算法、PageRank算法以及现有的PageRank改进算法,分析它们存在的优缺点;以此为基础提出了一种基于网页内容和时间反馈的PageRank改进算法。改进算法主要是针对词语出现在文档的不同位置和词语的不同长度,所能代表的语义特征不同,在传统TF-IDF公式基础上,增加词项位置权值和词项长度权值,进而综合求得词项权值,再利用向量空间模型计算有链接关系的网页间关于相同特征项的相似度权值;修正网页的时间反馈因子,考虑用网页被搜索引擎搜索到的周期数目来表示网页存在的时间长短。通过对这两方面的改进来度量网页间PageRank值传递的大小。为了验证改进算法的... 

【文章来源】:重庆理工大学重庆市

【文章页数】:60 页

【学位级别】:硕士

【部分图文】:

基于网页内容和时间反馈的网页排序PageRank算法研究


系统体系结构图

运行效果,网页,模块


网页搜集模块运行效果

运行效果,查询模块,网页


查询模块运行效果

【参考文献】:
期刊论文
[1]PageRank算法研究综述[J]. 李稚楹,杨武,谢治军.  计算机科学. 2011(S1)
[2]PageRank算法的分析及其改进[J]. 王德广,周志刚,梁旭.  计算机工程. 2010(22)
[3]一种基于PageRank的页面排序改进算法[J]. 王冬,雷景生.  微电子学与计算机. 2009(04)
[4]基于主题相似度模型的TS-PageRank算法[J]. 黄德才,戚华春,钱能.  小型微型计算机系统. 2007(03)
[5]PageRank算法研究[J]. 黄德才,戚华春.  计算机工程. 2006(04)
[6]基于向量空间模型的网页文本表示改进算法[J]. 曾致远,张莉.  计算机工程. 2006(03)
[7]搜索引擎技术研究与发展[J]. 印鉴,陈忆群,张钢.  计算机工程. 2005(14)
[8]搜索引擎的排序技术研究[J]. 杨思洛.  现代图书情报技术. 2005(01)
[9]基于改进向量空间模型的Web信息检索技术研究[J]. 雷景生,林冬雪,符浅浅.  计算机工程. 2005(01)
[10]加速评估算法:一种提高Web结构挖掘质量的新方法[J]. 张岭,马范援.  计算机研究与发展. 2004(01)

硕士论文
[1]基于时态信息的主题搜索引擎的研究与实现[D]. 孙逸雪.中国科学技术大学 2009
[2]专业搜索引擎的排序算法研究[D]. 徐金雷.南京师范大学 2007
[3]搜索引擎排序算法的研究[D]. 陈洁惠.河海大学 2007
[4]基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D]. 薛鹏军.南京农业大学 2001



本文编号:3603344

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3603344.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1804a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com