自然场景图像中文本提取技术研究

发布时间:2017-04-30 12:01

  本文关键词:自然场景图像中文本提取技术研究,由笔耕文化传播整理发布。


【摘要】:作为人类思想和情感的载体,文本包含着至关重要的信息。自然场景图像中的文本提取在导航、敏感信息监管、场景理解、人机交互、基于内容的图像检索技术等方面都有广阔的应用前景,成为近年来研究的热点。本文依托国家“十二五”863计划主题项目“电信网安全系统(二期)”,围绕自然场景图像中文本提取中的两个关键技术,文本检测和文本识别分别进行研究,并最终构建成场景文本提取系统。主要工作和贡献如下:1.提出了一种基于树修剪和多特征融合的场景文本检测算法。首先,提取出图像中的边缘叠加的最大稳定极值区作为字符候选区域,针对这些区域往往存在大量的重复文本区域和非文本区域将会干扰后续检测的问题,基于最大稳定极值区构成的树结构,利用父子节点的宽高比和面积比,将重复的极值区域剔除;然后,利用场景文本的笔画特征和边缘上的梯度直方图特征在区分文本区域和非文本区域上的互补性,基于贝叶斯分类器对两种特征进行融合以剔除非文本区域;最后再根据字符的颜色、笔画宽度、大小等特征,设定规则作为相似性标准合并文本区域。实验结果表明,本文检测算法的综合性能指标略高于同类方法,且处理速度有较大提升。2.提出了一种基于稀疏编码直方图的场景文本识别算法。在上述的场景文本检测方法产生的候选文本区域内使用此方法进一步对文本进行识别。首先,根据图像中文本外观复杂多变等特点,采用稀疏编码直方图特征对字符外观进行描述;然后,以构建稀疏编码直方图特征改进基于部件的树结构模型用于描述字符结构,并使用该模型得到单个字符的检测分数;最后,在字符识别结果的基础上,利用字符的检测分数,相邻字符区域的空间位置信息和语言知识融合构建条件随机场模型识别单词。实验结果表明,本文识别方法的识别率高出同类方法5.35%。3.基于本文提出的基于树修剪和多特征融合的场景文本检测算法以及基于稀疏编码直方图的场景文本识别方法,设计了场景文本提取系统的主要功能模块、组成结构、处理流程等,并基于MATLAB进行仿真。最后,利用通用数据集和现网中采集到的图片对系统性能进行了验证。
【关键词】:场景文本提取 最大稳定极值区 贝叶斯分类器 可变形部件模型 条件随机场模型 稀疏编码直方图
【学位授予单位】:解放军信息工程大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
  • 摘要4-5
  • Abstract5-11
  • 第一章 绪论11-17
  • 1.1 研究背景及意义11-12
  • 1.2 自然场景文本提取面临的挑战12-15
  • 1.2.1 自然场景中的文本分类12-13
  • 1.2.2 自然场景中文本提取面临的挑战13-14
  • 1.2.3 现有自然场景文本提取方法存在的问题14-15
  • 1.3 本文研究贡献和组织结构15-17
  • 1.3.1 本文主要贡献15-16
  • 1.3.2 本文组织结构16-17
  • 第二章 场景文本提取方法概述17-23
  • 2.1 场景文本检测的研究现状17-18
  • 2.1.1 基于连通区域分析的方法17
  • 2.1.2 基于滑动窗口分类的方法17-18
  • 2.1.3 现有方法的对比分析18
  • 2.2 场景文本识别的研究现状18-19
  • 2.2.1 字符识别18-19
  • 2.2.2 单词识别19
  • 2.2.3 现有方法的对比分析19
  • 2.3 常用数据集及算法评估指标19-22
  • 2.3.1 数据集20-21
  • 2.3.2 算法评估指标21-22
  • 2.4 本章小结22-23
  • 第三章 基于树修剪和多特征融合的场景文本检测23-31
  • 3.1 场景文本检测23-28
  • 3.1.1 边缘叠加的MSER提取23-24
  • 3.1.2 基于MSER树修剪的重复文本候选区域剔除24-25
  • 3.1.3 基于贝叶斯多特征融合的非文本候选区域剔除25-27
  • 3.1.4 基于文本结构特点的文本候选区域合并27-28
  • 3.2 实验结果及分析28-29
  • 3.3 本章小结29-31
  • 第四章 基于稀疏编码直方图的场景文本识别31-41
  • 4.1 场景文本识别算法流程31
  • 4.2 字符的稀疏编码直方图特征描述31-32
  • 4.2.1 稀疏编码表示局部特征描述子31-32
  • 4.2.2 稀疏编码直方图聚合32
  • 4.2.3 高维稀疏编码描述子降维32
  • 4.3 基于HSC-TSM的字符识别32-34
  • 4.4 基于CRF模型的单词识别34-36
  • 4.4.1 基于树结构的图构建35
  • 4.4.2 代价函数35
  • 4.4.3 基于TRW-S算法的单词推断35-36
  • 4.5 实验结果及分析36-39
  • 4.5.1 字符识别的结果及分析36-37
  • 4.5.2 单词识别的结果及分析37-39
  • 4.6 本章小结39-41
  • 第五章 场景文本提取系统的设计与实现41-47
  • 5.1 系统总体设计41-44
  • 5.1.1 系统主要功能41-42
  • 5.1.2 系统组成结构42
  • 5.1.3 系统流程42-44
  • 5.2 系统性能测试及分析44-45
  • 5.2.1 测试集构造44
  • 5.2.2 测试结果与分析44-45
  • 5.3 本章小结45-47
  • 第六章 总结与展望47-49
  • 6.1 本文的工作总结47-48
  • 6.2 下一步研究工作展望48-49
  • 致谢49-51
  • 参考文献51-57
  • 作者简历 攻读硕士学位期间完成的主要工作57

【参考文献】

中国期刊全文数据库 前3条

1 张伟伟;汤光明;孙怡峰;李晓利;;基于DPM的自然场景下汉字识别方法[J];计算机应用研究;2013年03期

2 何耀平;徐丽珍;;自然场景下交通标志的自动识别算法[J];微计算机信息;2010年04期

3 庄越挺,刘骏伟,吴飞,潘云鹤,张引;基于支持向量机的视频字幕自动定位与提取[J];计算机辅助设计与图形学学报;2002年08期


  本文关键词:自然场景图像中文本提取技术研究,由笔耕文化传播整理发布。



本文编号:336791

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/336791.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户dbdd8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]