基于关联分析和聚类的领域本体构建方法及其应用研究
本文关键词:基于关联分析和聚类的领域本体构建方法及其应用研究,由笔耕文化传播整理发布。
【摘要】: 本体的概念起源于哲学领域,由希腊哲学家亚里士多德将本体定义为研究“存在”的科学。20世纪90年代以来,本体的概念被引入人工智能、知识工程和图书情报领域,成为科学研究的基础,在思维、信息传播、组织和检索中发挥着重要作用。 本体是一种用来描述概念以及概念间关系的知识组织方法,自提出以来就引起了国内外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用。作为本体应用研究的一项基础性工作——本体的构建方法,也吸引了国内外众多科研人员的关注。目前还没有成熟、统一的方法论指导本体的构建工作,建立相对完整的领域本体,不仅需要捕获大量的领域概念,而且必须处理这些领域概念的语义冲突、二义性等问题。这使构建本体的工作成为既单调乏味,又困难棘手的任务,成为知识获取的瓶颈。另外,虽然现有本体构建工具的编辑环境已经可以满足建立本体的需要,但是完全靠人工搜集领域概念及领域概念间的关系来构建本体,仍然是一项费时费力的工作,使得基于本体的应用难以推广。 本文在调研了国内外大量文献和网页的基础上,全面研究探索了本体的理论与方法。阐述了本体的起源、内涵、分类和应用,介绍了国内外关于本体构建研究的相关进展、原则、方法和工具,分析了目前本体构建存在的问题。为解决这些问题,本文提出将面向文本的知识发现技术应用到领域本体的构建过程中,通过对领域语料库文本的处理,从语料中自动提取领域概念,并以关联分析和聚类分析为工具发现领域概念间关系,最后通过人工校验来修正结果,从而减少对领域专家的依赖,提高本体构建的自动化程度,加快本体的构建过程。在这些理论和方法的指导下,本文创建了一个以等离子专利信息资源为应用领域的领域本体。
【关键词】:领域本体构建 聚类 关联分析 概念提取 概念关系发现
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:H0-05
【目录】:
- 摘要5-6
- Abstract6-8
- 目录8-10
- 图表目录10-12
- 1 绪论12-23
- 1.1 本文研究背景12-13
- 1.2 本体概述13-18
- 1.2.1 本体的内涵14
- 1.2.2 本体的分类14-16
- 1.2.3 本体的研究与应用16-18
- 1.3 本文研究意义18-19
- 1.4 研究内容与方法19-23
- 1.4.1 研究思路和内容19-21
- 1.4.2 研究方法21-22
- 1.4.3 创新点22-23
- 2 基于文本知识发现的领域本体构建框架研究23-42
- 2.1 本体构建相关研究进展23-30
- 2.1.1 本体构建的研究现状23-24
- 2.1.2 本体构建的原则24
- 2.1.3 本体构建的方法24-27
- 2.1.4 本体构建的工具27-29
- 2.1.5 本体构建存在的问题29-30
- 2.2 面向文本的知识发现概述30-37
- 2.2.1 知识发现的内涵30-32
- 2.2.2 知识发现的应用32-33
- 2.2.3 文本知识发现的主要类型33-37
- 2.3 文本知识发现技术在领域本体构建中的应用框架37-42
- 2.3.1 现有研究的现状37-38
- 2.3.2 应用研究所需的技术方法38-39
- 2.3.3 基于文本知识发现的领域本体构建的框架39-42
- 3 领域概念的自动提取方法研究42-57
- 3.1 主要功能与步骤42-44
- 3.2 中文文本自动分词44-46
- 3.3 中文术语提取46-55
- 3.3.1 典型的中文术语提取方法46-48
- 3.3.2 一种基于隐性马尔可夫模型的中文术语提取方法48-55
- 3.4 术语领域相关度判断55-57
- 4 领域概念间典型关系的自动发现方法研究57-72
- 4.1 领域概念间的典型关系及其自动发现57-59
- 4.1.1 领域概念间的关系及发现方法57-58
- 4.1.2 概念关系发现的处理步骤58-59
- 4.2 领域概念的关联分析59-62
- 4.2.1 基于关联规则挖掘的关联分析59-60
- 4.2.2 基于共现的关联分析60-61
- 4.2.3 基于相关性统计的关联分析61-62
- 4.3 领域概念间聚类及关系发现62-72
- 4.3.1 聚类的内涵与一般流程62-64
- 4.3.2 典型的聚类算法64-67
- 4.3.3 一种基于“最小最大”原则的初始质心优选的K-means聚类算法67-72
- 5 基于关联分析和聚类的领域本体构建系统研究及实验评估72-94
- 5.1 系统总体结构图72-73
- 5.2 实验语料及实验流程说明73-75
- 5.3 领域概念的自动提取实验75-78
- 5.4 领域概念间典型关系的自动发现实验78-85
- 5.5 领域本体的构建实验85-94
- 6 结束语94-97
- 6.1 本文所做的工作94-95
- 6.2 研究中存在的问题和后续研究95
- 6.3 展望95-97
- 致谢97-98
- 参考文献98-104
- 附录104
【相似文献】
中国重要会议论文全文数据库 前10条
1 杨勰;刘群;吴渝;;基于聚类算法的粒子系统模拟实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
2 樊迪;刘振明;金宏威;张亮仁;张礼和;;基于配体结合模式的辅酶A结合蛋白的分类方法研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
3 高冠东;贾克斌;肖珂;;一种新的基于特征点匹配的图像拼接方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
4 马垣;张红云;李晓瑞;刘刚;张小平;马文胜;;关系数据库中基于拓扑空间的聚类方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 秦龙;吴义坚;王仁华;;基于HMM的说话人转换中MLLR回归矩阵绑定方法的研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 谢毓湘;栾悉道;吴玲达;文军;老松杨;;一种基于聚类的播音员镜头探测方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 赵晓煜;康锦江;;基于客户价值的客户聚类及特征分析方法[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年
8 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 王云龙;李逊;;基于数据场的数据挖掘方法在入侵检测中的应用[A];第十九次全国计算机安全学术交流会论文集[C];2004年
10 李涵;;一种改进的聚类方法在异常检测中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
中国重要报纸全文数据库 前5条
1 本刊特稿 陈岩;鲁西南村名的文化解读[N];济宁日报;2007年
2 李海峰;优化无功管理 实现电网安全运行[N];国家电网报;2008年
3 王国定 宋瑞卿 王永亮;山西上市公司综合实力谁强?[N];山西日报;2001年
4 王宇乔;减肥品男性消费群不容忽视[N];民营经济报;2005年
5 本报实习生 庞仕影;权威榜单不能让数字牵着走[N];国际金融报;2004年
中国博士学位论文全文数据库 前10条
1 王勇;基于流形学习的分类与聚类方法及其应用研究[D];国防科学技术大学;2011年
2 熊峗;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
3 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
4 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年
5 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年
6 刘建伟;流数据查询系统结构及模式查询算法的研究[D];东华大学;2005年
7 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年
8 殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年
9 王昱;考虑特征变量异质性的分类方法及其在风险决策中的应用研究[D];中国科学技术大学;2009年
10 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
中国硕士学位论文全文数据库 前10条
1 张蓓蓓;基于关联分析和聚类的领域本体构建方法及其应用研究[D];南京理工大学;2009年
2 盛文峰;面向数据挖掘的遗传算法的研究与应用[D];上海交通大学;2007年
3 倪乐央;基于非参数方法的我国城市化水平聚类分析[D];浙江工商大学;2007年
4 伊莉娜;基于Agent的移动查询技术研究[D];哈尔滨理工大学;2008年
5 李国宇;基于J2EE的数据挖掘系统的构建及聚类技术研究[D];天津大学;2007年
6 吴孙丹;基于聚类的入侵检测方法的研究[D];华中科技大学;2007年
7 金燕;多时间序列数据流聚类算法研究[D];国防科学技术大学;2007年
8 李敏;基于网格和密度的数据流聚类算法研究[D];武汉理工大学;2009年
9 司学锋;基于聚类的BP神经网络在织物染色计算机配色中的应用研究[D];青岛大学;2009年
10 梁敏君;分形聚类分析在证券客户细分中的应用研究[D];合肥工业大学;2009年
本文关键词:基于关联分析和聚类的领域本体构建方法及其应用研究,,由笔耕文化传播整理发布。
本文编号:282929
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/282929.html