当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于语义的信息检索与关联推荐关键技术研究

发布时间:2017-05-03 17:14

  本文关键词:基于语义的信息检索与关联推荐关键技术研究,由笔耕文化传播整理发布。


【摘要】:随着互联网技术不断向前发展,信息量的增长速度已经到了叹为观止的地步。这样的发展速度导致用户从茫茫信息海洋之中寻找自己需要的信息已经变得十分的困难。搜索引擎的提出与推广从很大程度上解决的用户难于检索信息的麻烦。用户通过向搜索引擎提供搜索关键词,即能方便的找到自己需要的信息。然而传统搜索引擎在不断发展过程中遇到了很大的困难。首先,基于简单关键词匹配的传统搜索引擎检索方法使得搜索引擎无法准确的理解用户的所要表达的语义层面的意义,加大了用户查询信息的难度。其次,搜索引擎通常返回大量的搜索结果,而用户通常只会浏览前面几页或者十几页的结果,导致虽然搜索引擎返回了用户需要的结果,但由于排名靠后,其结果无法被用户看到。最后,虽然推荐系统现已大量运用于电商、在线音乐等等领域,但推荐算法任然存在比如数据稀疏导致推荐准确率下降等等问题。基于以上问题,作者对语义检索及推荐系统进行研究,并在现有成果基础上,提出了一些新方法。本论文主要工作包括:基于软件工程思想提出了一种新的本体库构建方法:螺旋本体法。该方法在本体构建过程中加入风险评估过程,并提出本体构建需要通过不断迭代来保证本体构建的正确性并能够有效的降低开发过程中将会面临的风险。在分析章节作者将螺旋本体法与其他常见的本体构建方法进行对比,指出该方法的优点,并通过protégé本体构建工具使用螺旋本体法构建本体库。提出一种适用于本体的索引结构并对Lucene的评分算法进行改进。首先通过对Lucene现有索引代码及结构的分析,提出一种适用于本体的Lucene索引结构。其次在分析了Lucene现有评分算法的基础上,提出一种综合考虑了查询关键词词频、用户点击量统计、基于经验三个方面的自动标记关键词权重的方法,并在此基础上对检索结果的本体进行评分,最后依据评分进行排序。通过实验证明,使用该索引结构与更新的评分算法能够提高检索结果。提出基于本体库的协同过滤推荐算法。分析已有协同过滤推荐算法,特别关注用户数据矩阵稀疏的问题,基于已有的本体理论,提出了新的协同过滤推荐算法。并通过实验证明使用基于本体库的协同过滤推荐算法能够提高推荐结果的准确率。
【关键词】:语义 信息检索 关联推荐 本体
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
  • 摘要5-6
  • ABSTRACT6-10
  • 第一章 绪论10-18
  • 1.1 研究工作的背景及意义10-11
  • 1.2 语义搜索研究现状11-13
  • 1.3 关联推荐技术研究现状13-15
  • 1.4 存在的问题及主要研究内容15-17
  • 1.4.1. 语义搜索及关联推荐存在的问题15-16
  • 1.4.2. 论文主要研究内容16-17
  • 1.5 论文结构安排17-18
  • 第二章 基于语义的信息检索与关联推荐相关技术18-35
  • 2.1 基于语义的信息检索与关联推荐体系架构18-19
  • 2.2 基于本体的语义推理技术19-29
  • 2.2.1. 本体库的构建20-27
  • 2.2.2. 关联信息源27-28
  • 2.2.3. 形式化查询28
  • 2.2.4. 逻辑化推理28-29
  • 2.3 本体信息检索模型29-31
  • 2.3.1. 布尔模型29
  • 2.3.2. 向量空间模型29-30
  • 2.3.3. 概率模型30
  • 2.3.4. 隐含语义索引模型30-31
  • 2.4 关联推荐系统31-34
  • 2.4.1. 基于内容的推荐31-32
  • 2.4.2. 关联规则推荐32-33
  • 2.4.3. 协同过滤推荐33-34
  • 2.5 本章小结34-35
  • 第三章 语义处理中领域本体的构建35-44
  • 3.1 本体库的构建标准35
  • 3.2 基于螺旋法的本体构建方法35-39
  • 3.2.1. 明确目标36-37
  • 3.2.2. 分析并化解风险37
  • 3.2.3. 本体开发37-38
  • 3.2.4. 撰写文档/制定下一阶段工作38-39
  • 3.3 使用protégé构建本体39-41
  • 3.4 螺旋本体法比较41-43
  • 3.5 本章小结43-44
  • 第四章 信息检索中基于Lucene的信息索引44-61
  • 4.1 基于本体属性的索引44-51
  • 4.1.1. Lucene的分析45-50
  • 4.1.2. 本体索引结构50-51
  • 4.2 检索结果评分51-55
  • 4.2.1. Lucene的评分机制51-52
  • 4.2.2. Lucene评分算法改进52-55
  • 4.3 实验与分析55-60
  • 4.3.1. 实验数据来源55
  • 4.3.2. 评价标准55-56
  • 4.3.3. 实验及结果56-58
  • 4.3.4. 实验演示58-60
  • 4.4 本章小结60-61
  • 第五章 关联推荐中的协同过滤推荐61-72
  • 5.1 问题的提出61-63
  • 5.1.1. 协同过滤算法分析61-62
  • 5.1.2. 一些问题62-63
  • 5.2 基于本体的协同过滤63-67
  • 5.2.1. 常见用户数据矩阵63-64
  • 5.2.2. 常用相似度算法64-65
  • 5.2.3. 基于本体的相似度计算65-67
  • 5.3 实验与分析67-71
  • 5.3.1. 实验数据来源67-68
  • 5.3.2. 评价标准68-69
  • 5.3.3. 实验及结果69-71
  • 5.4 本章小结71-72
  • 第六章 总结与展望72-75
  • 致谢75-76
  • 参考文献76-79

【参考文献】

中国期刊全文数据库 前1条

1 姜华;;基于本体的语义检索技术研究与实现[J];现代图书情报技术;2008年04期

中国博士学位论文全文数据库 前1条

1 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年


  本文关键词:基于语义的信息检索与关联推荐关键技术研究,由笔耕文化传播整理发布。



本文编号:343413

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/343413.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2ae15***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com