当前位置:主页 > 科技论文 > 搜索引擎论文 >

网络空间的人物信息聚合系统的设计与实现

发布时间:2022-02-26 07:46
  伴随着互联网核心技术的快速升级和持续增长的网络用户规模,网络空间中存在着大量的数据信息。这些信息涉及到社会生活的各个方面,但人作为所有社会活动的参与者,不难得出人物信息在互联网信息中的所占比例以及重要程度。人们希望从网络空间中获得特定人物信息,但是面对庞大的网络信息量,用户检索信息的难度大大增加。因此设计一个系统,从网络空间中爬取用户可能关注的信息,对这些信息进行聚合并生成不同人物实体的聚合结果,正确、迅速、整体地将用户真正关心的信息展示给他们。本论文根据用户实际需要对人物信息聚合系统的功能和非功能需求进行分析,对系统体系结构和子模块功能进行设计,深入研究网络人物信息聚合的实际技术解决方法,实现了一个网络空间的人物信息聚合系统,具体完成工作如下:结合搜索引擎设计多线程爬虫对用户关注的人物信息网址进行采集,通过基于网页结构和统计特征的正文抽取方法构建同名人物的网页信息库。利用词袋模型、TF-IDF算法结合N元模型提取人物网页的不同特征信息,通过使用向量空间模型对每个网页信息文本构建文本特征向量。对比分析文本聚类中的相关聚类方法,评估近邻传播算法和凝聚层次聚类算法在网页人物信息文本中的聚类... 

【文章来源】:北京邮电大学北京市211工程院校教育部直属院校

【文章页数】:90 页

【学位级别】:硕士

【部分图文】:

网络空间的人物信息聚合系统的设计与实现


图2-1?HTML网页的DOM树表示形式??CSS选择器就是基于DOM树的特征进行网页抽取的,选择器会通过匹配树??中的标记和属性来解释网页内容应属于标记的哪个部分,元素取决于它们在文档??

用例图,非功能需求,用例图,信息库


于聚合结果,需要以可视化的形式展示,用户可以通过交互查看自己关注的内容,??如果对于聚合结果有误的话,用户能以简洁地操作对其修改,对人物信息库进行??正确地管理。下面具体对系统功能需求进行阐述(如用例图3-1所示):??(1)

设计图,系统设计模式,系统需求分析,架构设计


于聚合结果,需要以可视化的形式展示,用户可以通过交互查看自己关注的内容,??如果对于聚合结果有误的话,用户能以简洁地操作对其修改,对人物信息库进行??正确地管理。下面具体对系统功能需求进行阐述(如用例图3-1所示):??(1)


本文编号:3644253

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3644253.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户79381***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com