跨语言专利分析方法研究

发布时间:2017-08-01 16:13

  本文关键词:跨语言专利分析方法研究


  更多相关文章: 跨语言 专利分析 术语抽取 句子对齐 术语对齐 相似度分析


【摘要】:专利分析广泛应用于管理领域,已成为研究热点。单语言专利分析只分析一种语言的专利,处理多语言专利的质量不高。多语言专利处理的困难之处,源于多语言专利技术的四大特点:术语新、跨语言、跨领域、全球化。本文在现有专利分析、自然语言处理、可视化分析的基础上,针对专利技术的特点,开展跨语言专利分析方法研究,为解决多语言专利分析问题提供了新思路和新方法。本文主要创新成果如下:(1)提出TValue跨语言专利术语抽取法,基于首尾词性规则进行词串抽取,通过词串的首尾词性度、词长度、独立度、停用度、重要度,计算五属性组合值TValue,识别TValue高于术语可信度的词串为获选术语。实验结果表明,该方法可有效地抽取低频术语、非名词术语,其质量高于同类方法。(2)提出HSI跨语言专利句子对齐法,通过句对的句长相关度、语义相关度、符号相似度、编号相似度,计算属性组合值SValue,识别同一文档中SValue较大的句对,获得1对1、1对0、0对1的句对齐,再通过句子合并、句子删除,获得多对1、1对多、多对多、多对0、0对多的句对齐。实验结果表明,该方法可有效地处理有噪音的句子对齐,其质量好于同类方法。(3)提出AGiza/ALLR跨语言专利术语对齐法,识别首尾相关度大于0的共句术语对,通过语义相关度、首尾相关度、词性相关度、独立相关度、停用相关度、GIZA++计算的g值、共现相关度、长度相关度,分别计算AGiza/ALLR术语对齐度,术语对齐度大于术语对齐阈值的术语对为对齐术语对。实验结果表明,在各种召回率时,两种方法的准确率都好于GIZA++、Dice、Φ2、LLR、K-VEC及DKVEC。(4)提出CCT跨语言专利相似度分析法,通过同义术语识别、同义术语分析,构建跨语言同义术语集,发现术语概念与对象共现关系,计算CCT相似度,基于CCT相似度构建跨语言网络图,基于跨语言网络图构建跨语言全球图、术语交叠图。实验结果表明,CCT跨语言专利相似度分析可对多语言专利进行有效分析。在中英文电池专利数据中,本文提出的上述方法得到了检验和验证研究,对科技管理、专利战略、文本挖掘、机器翻译、大数据管理等,具有参考作用和应用价值。
【关键词】:跨语言 专利分析 术语抽取 句子对齐 术语对齐 相似度分析
【学位授予单位】:北京理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:H0-05
【目录】:
  • 摘要5-6
  • ABSTRACT6-17
  • 第1章 绪论17-43
  • 1.1 研究背景及意义17-19
  • 1.1.1 研究背景17-19
  • 1.1.2 研究意义19
  • 1.2 研究现状19-30
  • 1.2.1 基于统计的专利分析方法20
  • 1.2.2 基于自然语言处理的专利分析方法20-27
  • 1.2.3 基于文本挖掘的专利分析方法27-28
  • 1.2.4 可视化的专利分析方法28-30
  • 1.3 本文研究内容30-32
  • 1.4 论文组织结构32-34
  • 1.5 实验语料34-41
  • 1.5.1 训练术语库35
  • 1.5.2 训练句对库35
  • 1.5.3 通用术语库35
  • 1.5.4 专利数据整理策略35-36
  • 1.5.5 中英文电池专利摘要集36-37
  • 1.5.6 专利样本库37
  • 1.5.7 锂电池专利集37-41
  • 1.6 主要创新点41-43
  • 第2章 跨语言科技术语抽取方法研究43-61
  • 2.1 引言43-44
  • 2.2 术语抽取方法分析44-47
  • 2.3 相关假设47-48
  • 2.4 基于首尾词性规则的词串抽取48-49
  • 2.5 TVALUE计算49-55
  • 2.5.1 首尾词性度49-50
  • 2.5.2 词长度50-51
  • 2.5.3 独立度51-52
  • 2.5.4 停用度52-53
  • 2.5.5 重要度53-54
  • 2.5.6 TValue54-55
  • 2.6 中英文术语抽取实证55-59
  • 2.6.1 中文术语抽取55-56
  • 2.6.2 英文术语抽取56-57
  • 2.6.3 术语抽取法评价57-59
  • 2.7 本章小结59-61
  • 第3章 跨语言句子对齐分析方法研究61-79
  • 3.1 引言61-62
  • 3.2 句子对齐方法分析62-64
  • 3.3 相关假设64-66
  • 3.4 HSI跨语言专利句子对齐法66-74
  • 3.4.1 句长相关度66
  • 3.4.2 语义相关度66-68
  • 3.4.3 符号相似度68-69
  • 3.4.4 编号相似度69-70
  • 3.4.5 SValue70-71
  • 3.4.6 HSI对齐71-74
  • 3.5 中英文句子对齐实证74-78
  • 3.5.1 中英文符号对提取74
  • 3.5.2 中英文种子对整理74-75
  • 3.5.3 中英文句子对齐75
  • 3.5.4 句子对齐方法评价75-78
  • 3.6 本章小结78-79
  • 第4章 跨语言科技术语对齐方法研究79-97
  • 4.1 引言79-80
  • 4.2 术语对齐方法分析80-82
  • 4.3 相关假设82-83
  • 4.4 AGIZA/ALLR跨语言专利术语对齐法83-94
  • 4.4.1 共句术语对83-84
  • 4.4.2 共现相关度84-85
  • 4.4.3 长度相关度85
  • 4.4.4 独立相关度85-86
  • 4.4.5 停用相关度86
  • 4.4.6 语义相关度86-88
  • 4.4.7 首尾相关度88-89
  • 4.4.8 词性相似度89-90
  • 4.4.9 AGiza跨语言专利术语对齐90-92
  • 4.4.10 ALLR跨语言专利术语对齐92-94
  • 4.5 中英文术语对齐实证94-96
  • 4.5.1 候选术语对获取94
  • 4.5.2 属性参数估算94
  • 4.5.3 术语对齐法评价94-96
  • 4.5.4 电池术语库96
  • 4.6 本章小结96-97
  • 第5章 跨语言相似度分析方法研究97-127
  • 5.1 引言97-98
  • 5.2 相似度分析方法分析98-102
  • 5.3 相关假设102
  • 5.4 CCT跨语言专利相似度分析法102-114
  • 5.4.1 跨语言同义术语集103-105
  • 5.4.2 同义术语识别105-106
  • 5.4.3 同义术语分析106-107
  • 5.4.4 CCT相似度107-109
  • 5.4.5 潜在冲突分析109-111
  • 5.4.6 跨语言网络图111-112
  • 5.4.7 跨语言全球图112-113
  • 5.4.8 术语交叠图113-114
  • 5.5 相似度分析实证114-126
  • 5.5.1 同义术语识别115-116
  • 5.5.2 同义术语分析116-117
  • 5.5.3 潜在冲突分析117-119
  • 5.5.4 跨语言全球图119-121
  • 5.5.5 潜在冲突方合作分析121
  • 5.5.6 术语交叠基图121-122
  • 5.5.7 术语交叠全局图122-123
  • 5.5.8 单位术语交叠图123-126
  • 5.6 本章小结126-127
  • 第6章 总结与展望127-130
  • 6.1 研究总结127-128
  • 6.2 未来研究建议128-130
  • 参考文献130-151
  • 附录151-161
  • 附录A 锂电池核心专利单位国别获取的检索式151-155
  • 附录B 中文电池术语的首尾词性规则155-158
  • 附录C 英文电池术语的首尾词性规则158-159
  • 附录D 中英文符号对159-161
  • 攻读学位期间发表论文与研究成果清单161-162
  • 致谢162-163
  • 作者简介163

【相似文献】

中国期刊全文数据库 前1条

1 ;3D时代即将来临[J];科学观察;2010年04期

中国重要会议论文全文数据库 前10条

1 李铭;;基于专利权利信息的专利分析方法应用研究[A];第五届全国技术预见学术交流会暨全国技术预见与科技规划理论与实践研讨会会议论文集[C];2009年

2 陆守东;;专利分析与项目管理[A];2013年中华全国专利代理人协会年会暨第四届知识产权论坛论文汇编第三部分[C];2013年

3 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年

4 张方文;杨瑾瑾;于文吉;;我国竹材领域专利分析研究[A];第六届全国人造板工业科技发展研讨会论文集[C];2007年

5 张旭;仇颖;霍廖然;曹斌宏;候金伟;;浅谈专利代理与专利分析[A];2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第二部分)[C];2014年

6 徐闻;;国内防屈曲支撑专利技术现状[A];2014年中华全国专利代理人协会年会第五届知识产权论坛论文集(第一部分)[C];2014年

7 柳玲;;中国高速转向架技术专利分析[A];发展知识产权服务业,支撑创新型国家建设-2012年中华全国专利代理人协会年会第三届知识产权论坛论文选编(第二部分)[C];2011年

8 王帅;张雪;武姿;张宇;;企业专利分析方法及其对企业技术研发策略的影响——以某品牌冰箱在华专利申请为例[A];提升知识产权服务能力 促进创新驱动发展战略——2014年中华全国专利代理人协会年会第五届知识产权论坛优秀论文集[C];2014年

9 刘东吉;万新;陈云华;;肿瘤相关SNP分子标记相关专利分析研究[A];2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第三部分)[C];2014年

10 陈龙;程小梅;;车载FlexRay总线专利状况分析[A];2013年中华全国专利代理人协会年会暨第四届知识产权论坛论文汇编第三部分[C];2013年

中国重要报纸全文数据库 前10条

1 闫晓苏;专利分析价值几何?[N];中国知识产权报;2011年

2 本报记者 冯飞 实习记者 陈婕;专利分析普及推广项目助推产业发展[N];中国知识产权报;2014年

3 深讯;专利分析助力深圳重点产业发展[N];广东科技报;2008年

4 美国专利律师 薛之扬 谭文晔 本报驻美国记者 毛黎 供稿;专利和专利分析[N];科技日报;2010年

5 记者 裴宏 实习记者 蒋文杰;今年专利分析与预警项目启动[N];中国知识产权报;2010年

6 本报记者 赵笛;国内第一部海洋新能源专利分析报告在青出版[N];青岛日报;2011年

7 记者 刘阳子;要高度重视专利分析与预警工作[N];中国知识产权报;2011年

8 本报记者 贺延芳;2011年专利分析普及推广项目稳步推进[N];中国知识产权报;2011年

9 孙迪;家庭网络领域专利分析[N];中国知识产权报;2013年

10 董新蕊 朱振宁;“舌尖”上的专利分析之美[N];中国知识产权报;2014年

中国博士学位论文全文数据库 前1条

1 刘胜奇;跨语言专利分析方法研究[D];北京理工大学;2015年

中国硕士学位论文全文数据库 前10条

1 尹爽;面向政府专利分析服务需求的专利分析方法体系构建[D];吉林大学;2012年

2 杨敏;基于专利分析的OLED行业预警[D];上海交通大学;2014年

3 付贺龙;木材用生物质胶黏剂情报分析研究[D];中国林业科学研究院;2015年

4 陆勤虎;基于专利分析方法的区域科技创新能力比较研究[D];天津大学;2009年

5 唐炜;面向战略决策服务的专利分析指标研究[D];中国科学院研究生院(文献情报中心);2006年

6 高兆梓;基于专利分析的竞争对手分类系统研究[D];山东科技大学;2010年

7 范圣明;重组材技术专利分析研究[D];中国林业科学研究院;2012年

8 谢寿峰;基于专利分析的技术演变与预测研究[D];南京理工大学;2014年

9 岑明;专利分析对企业发展的影响[D];山东师范大学;2008年

10 李自香;基于专利分析的企业自主创新效率评价研究[D];山东大学;2014年



本文编号:605074

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/rwkxbs/605074.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户72af8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com