当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于用户反馈的智能查询扩展技术研究

发布时间:2017-05-24 18:20

  本文关键词:基于用户反馈的智能查询扩展技术研究,,由笔耕文化传播整理发布。


【摘要】:近年来,随着互联网信息技术的不断发展,它已经成为人们获取信息最重要的途径之一。而海量、异构、复杂的网络信息的存在,使人们快速准确地获取所需信息变得更为困难。搜索引擎作为互联网信息技术的一个重要分支,可以让人们更有效地获取所需信息。虽然现有的搜索引擎已能满足用户大部分的检索需求,但仍然存在有一些问题有待优化,如由于用户未能很好地组织查询以准确表达查询需求,使查询与文档索引之间不匹配,并造成检索结果准确率低等问题。本文研究的查询扩展技术是解决该问题的有效方式之一,主要的工作包括以下四个方面:通过实验分析相关的查询扩展算法,如基于LSA、Ontology、ESA、Rocchio、Ide、Ide-dec、LCA、LA、LOCOOC、Apriori、NNLM、KLD、CHI1、CHI2等技术的查询扩展算法,并进行各个算法之间的可融合分析、加权组合设计、参数调优等工作;通过对相关查询扩展算法的研究分析,本文提出了一种基于文档重排序的混合查询扩展算法,该算法首先在用户对初次检索提供反馈信息的基础上,通过所提的策略对初检文档进行重新排序,然后使用混合的查询扩展算法对重新排序后的前n篇文档进行分析;在OHSUMED数据集上进行多组对比实验,验证了本文提出的基于文档重排序的混合查询扩展算法能有效提高检索性能,其在平均准确率MAP等指标上较一些已有查询扩展算法有一定的提高;将提出的查询扩展算法应用于已有的一些搜索引擎中,其主要基于Google和Bing开放的API实现,首先用户交互式地提供反馈信息,然后应用本文提出的方法进行查询扩展分析,最后扩展出一些词语到初始查询中自动进行二次检索。
【关键词】:查询词扩展 相关反馈 文档重排 混合查询扩展
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要4-5
  • ABSTRACT5-8
  • 第1章 绪论8-12
  • 1.1 研究背景和意义8-9
  • 1.2 查询扩展技术研究现状9-10
  • 1.3 课题主要研究内容10-11
  • 1.4 本文的组织结构11-12
  • 第2章 相关理论知识及主要技术12-21
  • 2.1 信息检索技术12-18
  • 2.1.1 基本概念12
  • 2.1.2 信息检索模型12-17
  • 2.1.3 信息检索的评价指标17-18
  • 2.2 查询词扩展技术18-20
  • 2.2.1 基于全局分析的查询扩展技术18-19
  • 2.2.2 基于局部分析的查询扩展技术19
  • 2.2.3 基于本体语义的查询扩展技术19-20
  • 2.2.4 基于日志分析的查询扩展技术20
  • 2.3 本章小结20-21
  • 第3章 基本查询扩展技术研究21-37
  • 3.1 基于向量空间模型的查询扩展技术21-23
  • 3.1.1 向量空间模型21-22
  • 3.1.2 基于Rocchio的查询扩展22-23
  • 3.2 基于局部分析的查询扩展技术23-25
  • 3.3 基于关联规则的查询扩展技术25-28
  • 3.3.1 关联规则算法26-27
  • 3.3.2 基于Apriori的查询扩展27-28
  • 3.4 基于语义分析的查询扩展技术28-30
  • 3.4.1 隐式语义分析技术28-29
  • 3.4.2 显式语义分析技术29
  • 3.4.3 本体语义词典分析技术29-30
  • 3.5 基于信息论的查询扩展技术30-32
  • 3.5.1 信息熵理论30-31
  • 3.5.2 基于分布分析的查询扩展31-32
  • 3.6 基于NNLM的查询扩展技术32-36
  • 3.7 本章小结36-37
  • 第4章 基于文档重排的混合查询扩展技术研究37-42
  • 4.1 文档重排序策略37-39
  • 4.2 混合查询扩展策略39-41
  • 4.3 基于文档重排的混合查询扩展算法设计41
  • 4.4 本章小结41-42
  • 第5章 查询扩展实验分析与系统实现42-58
  • 5.1 数据集介绍与预处理42-44
  • 5.1.1 OHSUMED数据集介绍42-44
  • 5.1.2 数据预处理44
  • 5.2 实验系统总体设计44-46
  • 5.3 实验系统详细设计46-47
  • 5.3.1 文档重排序模块设计46
  • 5.3.2 查询扩展模块设计46-47
  • 5.4 实验系统实现与结果分析47-51
  • 5.4.1 开发平台及工具48
  • 5.4.2 各算法实验结果对比与分析48-51
  • 5.5 查询扩展技术的实际应用分析51-57
  • 5.6 本章小结57-58
  • 结论58-59
  • 参考文献59-64
  • 致谢64

【相似文献】

中国期刊全文数据库 前10条

1 阳小华;蒋辉;马家宇;;基于任务上下文的查询扩展方法[J];郑州大学学报(理学版);2010年01期

2 吴煈;张奇;黄萱菁;;基于整数线性规划的查询扩展[J];计算机研究与发展;2013年08期

3 何燕;;基于用户反馈的查询扩展研究[J];情报理论与实践;2013年08期

4 黄伟群;;基于用户视角的交互式查询扩展研究[J];图书情报工作;2014年05期

5 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期

6 林国俊;叶飞跃;耿冬;郑国良;;基于语义的概念查询扩展[J];计算机工程与设计;2009年06期

7 巩玉玺;王大玲;;一种改进的基于伪相关反馈的查询扩展[J];微计算机信息;2009年15期

8 黄名选;张师超;严小卫;;基于查询行为和关联规则的相关反馈查询扩展[J];计算机工程;2009年10期

9 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期

10 罗小聪;;基于专用双语词典的查询扩展[J];现代计算机(专业版);2009年10期

中国重要会议论文全文数据库 前10条

1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年

2 吕碧波;赵军;;基于相关文档池建模的查询扩展[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

3 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

5 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

6 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

7 王秉卿;张奇;吴立德;黄萱菁;;机器学习的查询扩展在博客检索中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

8 王秉卿;黄萱菁;;基于线性模型的查询扩展方法[A];第五届全国信息检索学术会议论文集[C];2009年

9 晋松;林鸿飞;苏绥;;基于标签共现的查询扩展研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

10 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

中国重要报纸全文数据库 前1条

1 钟威 何拥军;数字档案信息扩展查询功能需求分析及实现方式[N];中国档案报;2011年

中国博士学位论文全文数据库 前2条

1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年

2 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年

中国硕士学位论文全文数据库 前10条

1 吴德钰;基于标签筛选的文档排序方法研究[D];华中师范大学;2015年

2 李维银;基于有监督学习的查询扩展技术研究[D];北京理工大学;2015年

3 钟廷伟;生物医学文本的标注与检索研究[D];电子科技大学;2015年

4 王宇;煤矿安全事件本体构建及其查询扩展的研究与应用[D];北京工业大学;2015年

5 崔倩倩;基于文档重构的查询扩展[D];北京工业大学;2015年

6 陈建荣;基于用户反馈的智能查询扩展技术研究[D];哈尔滨工业大学;2014年

7 燕泽权;基于主题模型的查询扩展技术研究[D];哈尔滨工业大学;2014年

8 姚小同;查询扩展技术研究[D];北京邮电大学;2009年

9 许威;基于概念格的查询扩展系统及建格算法研究[D];北京邮电大学;2008年

10 胡保祥;基于查询日志的查询扩展研究[D];北京邮电大学;2013年


  本文关键词:基于用户反馈的智能查询扩展技术研究,由笔耕文化传播整理发布。



本文编号:391601

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/391601.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8c5b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com