当前位置:主页 > 科技论文 > 搜索引擎论文 >

海量本体数据存储平台的研究与设计

发布时间:2017-03-27 08:13

  本文关键词:海量本体数据存储平台的研究与设计,由笔耕文化传播整理发布。


【摘要】:伴随着互联网技术越发的成熟,网上的信息也越来越丰富。这些海量数据信息,分布于整个网络。由于目前的搜索引擎不能理解各个数据的语义信息,只能利用关键词匹配等技术进行搜索,这样所得到的搜索结果每每不能令人满意。当前互联网的主要问题在于其对真正存储的数据含义一无所知,只能算是存储数据的媒介。 在1998年语义网的概念被提出,其思想是使计算机去理解数据的含义,将数据联系到一起,使一个个数据孤岛变成巨大的数据网络,为用户提供更好的查询服务。近些年,随着语义网的快速发展,人们也越来越意识到一些关键的问题:如何能保证海量本体数据的高效查询,如何能加快本体数据积累速度,如何能提高本体数据的利用率。 本文首先介绍了建立海量本体数据平台的意义以及本体数据存储和本体数据应用的国内外研究现状。其次,介绍本体数据库的各种数据存储方式和代表数据库,并根据海量本体数据平台的要求进行对比分析,选取适合平台使用的本体数据库。之后根据选取的本体数据库特点和当前本体数据库查询缺陷,设计添加查询缓存,,提高本体数据查询效率。最后,根据本体数据和其他主流数据形式的特点,为平台设计添加数据转换机制,同步机制和可视化机制等,并进行相应的功能测试。 本课题的研究涉及语义网、数据存储、数据同步等多方面的内容。通过海量本体数据存储平台的建立,将会给语义网带来诸多好处。首先可以简化本体数据和主流数据形式之间的转换过程,一方面加快语义网数据的积累速度,另一方面也为针对语义网数据的分析研究开辟了通路。其次,平台提供了一套包括数据爬取、数据清洗去重、数据合成、数据存储、数据查询和数据导出等功能的本体数据积累和应用机制。除此之外,通过研究设计针对本体数据特点的查询缓存,提高了平台的本体数据查询效率,为用户提供更好的查询体验。总之,海量本体数据平台的建立将会对语义网的发展起到重要的作用。
【关键词】:语义网 本体数据 查询缓存 数据转换 数据同步
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1;TP333
【目录】:
  • 摘要4-5
  • Abstract5-7
  • 目录7-10
  • 第1章 绪论10-16
  • 1.1 课题研究的背景及意义10-12
  • 1.1.1 研究背景10-11
  • 1.1.2 研究意义11-12
  • 1.2 国内外研究现状12-14
  • 1.3 本论文的内容安排14-16
  • 1.3.1 主要研究内容14
  • 1.3.2 研究的重点难点14
  • 1.3.3 论文的结构安排14-16
  • 第2章 本体数据存储技术及数据库选型16-28
  • 2.1 本体数据存储技术16-18
  • 2.1.1 内存存储模型16
  • 2.1.2 文件存储模型16
  • 2.1.3 关系型数据库存储模型16-18
  • 2.2 本体数据查询语言18-20
  • 2.2.1 RDQL19
  • 2.2.2 SeRQL19
  • 2.2.3 SPARQL19-20
  • 2.3 海量本体数据存储平台底层本体数据选型20-26
  • 2.3.1 选型标准20-21
  • 2.3.2 本体数据库21
  • 2.3.3 Bigdata 本体数据库性能测试21-26
  • 2.4 本章小结26-28
  • 第3章 本体数据库查询优化方案28-38
  • 3.1 本体数据库查询问题分析28-29
  • 3.2 解决方案及相关技术介绍29-33
  • 3.2.1 拟采取解决方案29
  • 3.2.2 缓存技术29
  • 3.2.3 RC 缓存机制设计29-30
  • 3.2.4 应用算法30-33
  • 3.3 性能测试33-36
  • 3.3.1 基于 DBPedia 的随机 SPARQL 查询语句生成器33-34
  • 3.3.2 ARC Memory 算法命中率测试34-35
  • 3.3.3 基于 Bigdata 本体数据库的 RC 缓存机制性能测试35-36
  • 3.4 测试结论36
  • 3.5 本章小结36-38
  • 第4章 本体数据转换机制及同步机制38-52
  • 4.1 数据特点分析38-43
  • 4.1.1 本体数据(RDF 数据)特点分析38-40
  • 4.1.2 关系型数据库数据特点分析40-41
  • 4.1.3 数据表示方式41-42
  • 4.1.4 数据异同点分析42-43
  • 4.2 数据转换策略研究与设计43-46
  • 4.2.1 关系型数据到本体数据的转换43-45
  • 4.2.2 本体数据到关系型数据的转换45-46
  • 4.3 数据同步策略的研究与设计46-50
  • 4.3.1 同步机制建立目的46-48
  • 4.3.2 同步机制设计48-50
  • 4.4 本章小结50-52
  • 第5章 海量本体数据存储平台的设计52-58
  • 5.1 海量本体数据存储平台需求分析52
  • 5.2 海量本体数据存储平台整体设计52-53
  • 5.3 海量本体数据存储平台核心模块设计53-56
  • 5.3.1 数据转换模块53-54
  • 5.3.2 全文索引模块54-56
  • 5.4 本章小结56-58
  • 第6章 海量本体数据存储平台的开发与测试58-64
  • 6.1 开发环境简介58
  • 6.2 海量本体数据存储平台核心功能的实现与测试58-62
  • 6.2.1 平台主界面58
  • 6.2.2 知识库状态信息58-59
  • 6.2.3 RDF 数据查询浏览59-60
  • 6.2.4 RDF 数据转换功能60-62
  • 6.3 本章小结62-64
  • 结论64-66
  • 参考文献66-70
  • 攻读硕士学位期间发表的学术论文70-72
  • 致谢72

【参考文献】

中国期刊全文数据库 前1条

1 张剑;国外语义网发展概述[J];图书情报工作;2005年06期


  本文关键词:海量本体数据存储平台的研究与设计,由笔耕文化传播整理发布。



本文编号:270115

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/270115.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ea967***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com