当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于网页分块的主题搜索引擎的研究与实现.pdf 全文免费在线阅读

发布时间:2016-12-20 15:51

  本文关键词:基于网页分块的主题搜索引擎的研究与实现,,由笔耕文化传播整理发布。


文档介绍:
浙江工业大学硕士学位论文基于网页分块的主题搜索引擎的研究与实现姓名:高乐申请学位级别:硕士专业:计算机应用技术指导教师:张健20081110浙江工业人学硕士学位论文基于网页分块的主题搜索引擎的研究与实现摘要搜索引擎解决了网上查找信息难的问题。随着网络信息指数级增长以及行业分工不断加大,针对专业领域的信息搜索在精度和深度方面要求日益提高,主题搜索引擎必然成为搜索引擎的发展方向。然而,随着网页主题的多元化,以网页为最小单位进行处理的主题搜索引擎存在链接预测不准确、隧道穿越能力低、网页消重效果差、检索质量不高等问题,导致了主题搜索时易出现主题漂移现象。基于以上问题,本文将网页分块技术应用于主题搜索,在主题搜索时将网页中的内容块作为最小处理单元,而不再是整个网页。但传统网页分块算法对多主题网页分块效果不好,因此不适合应用到主题搜索引擎中。针对这一问题,本文提出一种能适应多主题网页分块的新算法CTVPS,该算法充分利用网页中的视觉信息、标签信息和链接信息,同时在分块过程中提出若干启发规则来控制分块的精度和粒度。在完成了网页分块的基础上,本文提出了与之适应的主题相关块提取方法即将文本分类中的分类模型移植到内容块分类中,实现了主题... 内容来自转载请标明出处.


  本文关键词:基于网页分块的主题搜索引擎的研究与实现,由笔耕文化传播整理发布。



本文编号:221159

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/221159.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户05c37***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com