当前位置:主页 > 科技论文 > 搜索引擎论文 >

面向不同对象的搜索引擎中的排序模型与性能评价

发布时间:2017-08-30 01:03

  本文关键词:面向不同对象的搜索引擎中的排序模型与性能评价


  更多相关文章: 信息检索 搜索引擎 对象级搜索 性能评价


【摘要】:目前,互联网规模不断扩大,成为人们最重要的信息来源之一,但同时也出现了“信息过载”的问题,网络上的信息增长速度过快,用户获取所需信息难度越来越大。因此,搜索引擎应运而生。随着搜索引擎的发展,目前有两个重要的研究方向:其一,传统搜索引擎是基于网页的,而网络上的信息承载方式已经不仅限于传统网页,因此需要探索新的搜索引擎技术;其二,搜索引擎层出不穷,质量参差不齐,需要有一种合适的方式来评价搜索引擎的性能。本文主要贡献有以下三点:第一,提出了一种新的对象级别搜索引擎的排序模型。本模型适用于多种对象存在的场合,是基于对象之间的链接关系的,从而具有通用性。第二,提出了UIG的概念。UIG与传统的DCG相比,衡量的信息更为准确。第三,提出了一种用于搜索引擎性能评价的搜索引擎的理想点击分布族。在实际应用中,可以通过搜索引擎的实际点击数据拟合其参数;同时,从实际点击分布与理想点击分布的差别上,可以反映出搜索引擎排序算法的缺陷与改进方向。本文所提出的对象级搜索引擎排序模型,首先以对象链接图为基础,计算单个对象对单个term的相关度,然后对多个term的相关度进行合并。本模型在ACM Portal数据集上得到验证取得较好效果。本文所提出的搜索引擎点击分布模型,是从寿命分布中的威布尔分布出发,并结合搜索引擎的特点加以修改所得。本模型在AOL、搜狗、微软搜索引擎数据集上得到验证取得较好效果。
【关键词】:信息检索 搜索引擎 对象级搜索 性能评价
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
  • 摘要5-6
  • ABSTRACT6-8
  • 第1章 绪论8-20
  • 1.1 引言8-9
  • 1.2 研究背景9-16
  • 1.2.1 信息检索9-14
  • 1.2.2 对象级别的搜索14-15
  • 1.2.3 搜索引擎性能评价15-16
  • 1.3 本文动因16-17
  • 1.4 本文研究内容与主要贡献17-18
  • 1.5 本文章节安排18-20
  • 第2章 相关工作综述20-28
  • 2.1 引言20
  • 2.2 传统搜索引擎算法20-23
  • 2.3 对象级搜索算法23-24
  • 2.4 搜索引擎性能评价方法24-26
  • 2.5 本章小结26-28
  • 第3章 对象级搜索引擎的排序模型研究28-38
  • 3.1 引言28-29
  • 3.2 对象影响力计算29-31
  • 3.3 单个查询的相关度计算31-33
  • 3.4 多个查询的相关度合并33-34
  • 3.5 实验数据与结果34-36
  • 3.5.1 单个查询的性能对比34-35
  • 3.5.2 多个查询的合并性能对比35-36
  • 3.6 本章小结36-38
  • 第4章 搜索引擎性能评价38-54
  • 4.1 引言38
  • 4.2 搜索引擎性能评价标准38-40
  • 4.3 搜索引擎中用户点击分布的理想模型40-46
  • 4.3.1 搜索结果页内总点击率的分布模型41-43
  • 4.3.2 搜索结果页内每个文档的点击分布模型43-44
  • 4.3.3 模型中的参数估计44-46
  • 4.4 实验结果46-52
  • 4.4.1 搜索结果页内总点击率拟合47-49
  • 4.4.2 搜索结果页中总点击率拟合49-52
  • 4.5 本章小结52-54
  • 第5章 总结与展望54-56
  • 参考文献56-60
  • 致谢60-62
  • 在读期间发表的学术论文与取得的其他研究成果62


本文编号:756391

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/756391.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77b8b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com