当前位置:主页 > 文艺论文 > 语言学论文 >

基于关联分析和聚类的领域本体构建方法及其应用研究

发布时间:2017-04-02 18:10

  本文关键词:基于关联分析和聚类的领域本体构建方法及其应用研究,由笔耕文化传播整理发布。


【摘要】: 本体的概念起源于哲学领域,由希腊哲学家亚里士多德将本体定义为研究“存在”的科学。20世纪90年代以来,本体的概念被引入人工智能、知识工程和图书情报领域,成为科学研究的基础,在思维、信息传播、组织和检索中发挥着重要作用。 本体是一种用来描述概念以及概念间关系的知识组织方法,自提出以来就引起了国内外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用。作为本体应用研究的一项基础性工作——本体的构建方法,也吸引了国内外众多科研人员的关注。目前还没有成熟、统一的方法论指导本体的构建工作,建立相对完整的领域本体,不仅需要捕获大量的领域概念,而且必须处理这些领域概念的语义冲突、二义性等问题。这使构建本体的工作成为既单调乏味,又困难棘手的任务,成为知识获取的瓶颈。另外,虽然现有本体构建工具的编辑环境已经可以满足建立本体的需要,但是完全靠人工搜集领域概念及领域概念间的关系来构建本体,仍然是一项费时费力的工作,使得基于本体的应用难以推广。 本文在调研了国内外大量文献和网页的基础上,全面研究探索了本体的理论与方法。阐述了本体的起源、内涵、分类和应用,介绍了国内外关于本体构建研究的相关进展、原则、方法和工具,分析了目前本体构建存在的问题。为解决这些问题,本文提出将面向文本的知识发现技术应用到领域本体的构建过程中,通过对领域语料库文本的处理,从语料中自动提取领域概念,并以关联分析和聚类分析为工具发现领域概念间关系,最后通过人工校验来修正结果,从而减少对领域专家的依赖,提高本体构建的自动化程度,加快本体的构建过程。在这些理论和方法的指导下,本文创建了一个以等离子专利信息资源为应用领域的领域本体。
【关键词】:领域本体构建 聚类 关联分析 概念提取 概念关系发现
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:H0-05
【目录】:
  • 摘要5-6
  • Abstract6-8
  • 目录8-10
  • 图表目录10-12
  • 1 绪论12-23
  • 1.1 本文研究背景12-13
  • 1.2 本体概述13-18
  • 1.2.1 本体的内涵14
  • 1.2.2 本体的分类14-16
  • 1.2.3 本体的研究与应用16-18
  • 1.3 本文研究意义18-19
  • 1.4 研究内容与方法19-23
  • 1.4.1 研究思路和内容19-21
  • 1.4.2 研究方法21-22
  • 1.4.3 创新点22-23
  • 2 基于文本知识发现的领域本体构建框架研究23-42
  • 2.1 本体构建相关研究进展23-30
  • 2.1.1 本体构建的研究现状23-24
  • 2.1.2 本体构建的原则24
  • 2.1.3 本体构建的方法24-27
  • 2.1.4 本体构建的工具27-29
  • 2.1.5 本体构建存在的问题29-30
  • 2.2 面向文本的知识发现概述30-37
  • 2.2.1 知识发现的内涵30-32
  • 2.2.2 知识发现的应用32-33
  • 2.2.3 文本知识发现的主要类型33-37
  • 2.3 文本知识发现技术在领域本体构建中的应用框架37-42
  • 2.3.1 现有研究的现状37-38
  • 2.3.2 应用研究所需的技术方法38-39
  • 2.3.3 基于文本知识发现的领域本体构建的框架39-42
  • 3 领域概念的自动提取方法研究42-57
  • 3.1 主要功能与步骤42-44
  • 3.2 中文文本自动分词44-46
  • 3.3 中文术语提取46-55
  • 3.3.1 典型的中文术语提取方法46-48
  • 3.3.2 一种基于隐性马尔可夫模型的中文术语提取方法48-55
  • 3.4 术语领域相关度判断55-57
  • 4 领域概念间典型关系的自动发现方法研究57-72
  • 4.1 领域概念间的典型关系及其自动发现57-59
  • 4.1.1 领域概念间的关系及发现方法57-58
  • 4.1.2 概念关系发现的处理步骤58-59
  • 4.2 领域概念的关联分析59-62
  • 4.2.1 基于关联规则挖掘的关联分析59-60
  • 4.2.2 基于共现的关联分析60-61
  • 4.2.3 基于相关性统计的关联分析61-62
  • 4.3 领域概念间聚类及关系发现62-72
  • 4.3.1 聚类的内涵与一般流程62-64
  • 4.3.2 典型的聚类算法64-67
  • 4.3.3 一种基于“最小最大”原则的初始质心优选的K-means聚类算法67-72
  • 5 基于关联分析和聚类的领域本体构建系统研究及实验评估72-94
  • 5.1 系统总体结构图72-73
  • 5.2 实验语料及实验流程说明73-75
  • 5.3 领域概念的自动提取实验75-78
  • 5.4 领域概念间典型关系的自动发现实验78-85
  • 5.5 领域本体的构建实验85-94
  • 6 结束语94-97
  • 6.1 本文所做的工作94-95
  • 6.2 研究中存在的问题和后续研究95
  • 6.3 展望95-97
  • 致谢97-98
  • 参考文献98-104
  • 附录104

【相似文献】

中国重要会议论文全文数据库 前10条

1 杨勰;刘群;吴渝;;基于聚类算法的粒子系统模拟实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

2 樊迪;刘振明;金宏威;张亮仁;张礼和;;基于配体结合模式的辅酶A结合蛋白的分类方法研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

3 高冠东;贾克斌;肖珂;;一种新的基于特征点匹配的图像拼接方法[A];第十三届全国图象图形学学术会议论文集[C];2006年

4 马垣;张红云;李晓瑞;刘刚;张小平;马文胜;;关系数据库中基于拓扑空间的聚类方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

5 秦龙;吴义坚;王仁华;;基于HMM的说话人转换中MLLR回归矩阵绑定方法的研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年

6 谢毓湘;栾悉道;吴玲达;文军;老松杨;;一种基于聚类的播音员镜头探测方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

7 赵晓煜;康锦江;;基于客户价值的客户聚类及特征分析方法[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年

8 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

9 王云龙;李逊;;基于数据场的数据挖掘方法在入侵检测中的应用[A];第十九次全国计算机安全学术交流会论文集[C];2004年

10 李涵;;一种改进的聚类方法在异常检测中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年

中国重要报纸全文数据库 前5条

1 本刊特稿 陈岩;鲁西南村名的文化解读[N];济宁日报;2007年

2 李海峰;优化无功管理 实现电网安全运行[N];国家电网报;2008年

3 王国定 宋瑞卿 王永亮;山西上市公司综合实力谁强?[N];山西日报;2001年

4 王宇乔;减肥品男性消费群不容忽视[N];民营经济报;2005年

5 本报实习生 庞仕影;权威榜单不能让数字牵着走[N];国际金融报;2004年

中国博士学位论文全文数据库 前10条

1 王勇;基于流形学习的分类与聚类方法及其应用研究[D];国防科学技术大学;2011年

2 熊峗;生物序列模式挖掘与聚类研究[D];复旦大学;2007年

3 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年

4 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年

5 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年

6 刘建伟;流数据查询系统结构及模式查询算法的研究[D];东华大学;2005年

7 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年

8 殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年

9 王昱;考虑特征变量异质性的分类方法及其在风险决策中的应用研究[D];中国科学技术大学;2009年

10 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年

中国硕士学位论文全文数据库 前10条

1 张蓓蓓;基于关联分析和聚类的领域本体构建方法及其应用研究[D];南京理工大学;2009年

2 盛文峰;面向数据挖掘的遗传算法的研究与应用[D];上海交通大学;2007年

3 倪乐央;基于非参数方法的我国城市化水平聚类分析[D];浙江工商大学;2007年

4 伊莉娜;基于Agent的移动查询技术研究[D];哈尔滨理工大学;2008年

5 李国宇;基于J2EE的数据挖掘系统的构建及聚类技术研究[D];天津大学;2007年

6 吴孙丹;基于聚类的入侵检测方法的研究[D];华中科技大学;2007年

7 金燕;多时间序列数据流聚类算法研究[D];国防科学技术大学;2007年

8 李敏;基于网格和密度的数据流聚类算法研究[D];武汉理工大学;2009年

9 司学锋;基于聚类的BP神经网络在织物染色计算机配色中的应用研究[D];青岛大学;2009年

10 梁敏君;分形聚类分析在证券客户细分中的应用研究[D];合肥工业大学;2009年


  本文关键词:基于关联分析和聚类的领域本体构建方法及其应用研究,,由笔耕文化传播整理发布。



本文编号:282929

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/282929.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户80996***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com