当前位置:主页 > 科技论文 > 搜索引擎论文 >

图像中文字检测技术研究与实现

发布时间:2017-08-28 20:52

  本文关键词:图像中文字检测技术研究与实现


  更多相关文章: 字幕文字 场景文字 文字检测 文字定位 GSWT MSER


【摘要】:在互联网上,搜索引擎Google、百度、Bing等改变了整个时代,便捷了所有人的生活,然而它们是基于文字搜索的,对于图片和视频等基于内容的搜索还不大成熟。随着成千上万的视频传上互联网,对浏览和检索视频数据的工具需求越来越迫切。图像文字信息提取系统能够将图像中的文字检测出来并识别,自动建立图像索引,随后传统的搜索引擎就能够对图像进行检索。完整的图像文字信息提取系统包括检测、定位、提取、增强和识别图像中的文字,一般也把这个过程归纳为主要的两步:文字检测和文字识别。本文研究的是文字检测,包括字幕文字的检测和场景文字的检测。在检测字幕文字时,本文改进实现了一种基于区域的方法,先用边缘检测算子得到图像的边缘信息,再计算其最大差分标准图,采用局部阈值法将其二值化,然后利用游程平滑算法将文字连接成文字串,最后经过区域分析定位文字区域。本文方法原理清晰,计算量小,鲁棒性高。检测场景文字时,本文基于MSER和SWT算法,提出了一种新型的算子GSWT用于检测文字。最稳定极值区域(MSER)在模糊、低对比度和低光照、彩色和纹理变化的情况下鲁棒性较好,而GSWT是检测文字笔划的可靠方法,二者结合使用可以提高文字检测的准确率。考虑到场景文字中可能含有噪声,此时原来的方法会受到大幅的影响,一方面噪声的增多,使得MSER区域增多,给GSWT带来了计算量的增大;另一方面噪声的出现,使得虚警的概率升高,文字提取的准确率会下降。因此,本文探讨了两种保持边缘平滑滤波器(EPSF)——导向滤波器和自适应流型滤波器。在处理和分析含噪声的图像文字时,EPSF能够过滤噪声,同时文字的边缘信息得到保留,此时基于MSER和SWT的方法依然可行。本文仿真实现了基于区域的字幕文字检测系统和基于MSER和GSWT的场景文字检测系统,对标准数据库进行的测试表明,本文所实现的方法达到了同类较先进的水平。
【关键词】:字幕文字 场景文字 文字检测 文字定位 GSWT MSER
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.41
【目录】:
  • 摘要9-10
  • ABSTRACT10-11
  • 第一章 绪论11-18
  • 1.1 论文研究的背景与意义11-13
  • 1.1.1 图像文字处理与分析的简史11-12
  • 1.1.2 研究背景与意义12-13
  • 1.2 当前研究的发展与现状13-15
  • 1.3 论文的内容及结构安排15-18
  • 第二章 图像文字检测的方法18-28
  • 2.1 相关概念及文字特点18-21
  • 2.2 图像文字检测的方法21-27
  • 2.2.1 基于区域的文字检测方法21-25
  • 2.2.2 基于纹理的文字检测方法25-26
  • 2.2.3 综合性方法26-27
  • 2.3 本章小结27-28
  • 第三章 字幕文字检测28-42
  • 3.1 图像预处理和二值化29-34
  • 3.1.1 图像预处理29-30
  • 3.1.2 图像二值化30-34
  • 3.2 文字区域检测34-38
  • 3.2.1 虚警和噪声抑制及RLSA34-35
  • 3.2.2 连通区域分析35-38
  • 3.3 多分辨率处理38-39
  • 3.4 实验结果和性能分析39-41
  • 3.5 本章小结41-42
  • 第四章 场景文字检测42-68
  • 4.1 保持边缘平滑滤波器43-50
  • 4.1.1 EPSF43-44
  • 4.1.2 导向滤波器(GF)44-47
  • 4.1.3 AM滤波器47-50
  • 4.2 MSER50-53
  • 4.2.1 MSER的原理50-51
  • 4.2.2 MSER的性能分析与应用51-53
  • 4.3 GSWT算法及实现53-58
  • 4.3.1 梯度53-54
  • 4.3.2 GSWT算法原理54-57
  • 4.3.3 GSWT算法实现57-58
  • 4.4 文字的几何特征分析58-64
  • 4.4.1 生成连通区域58-59
  • 4.4.2 单个文字区域分析59-60
  • 4.4.3 文字间几何特征分析60-63
  • 4.4.4 筛选63-64
  • 4.5 实验结果64-65
  • 4.5.1 数据库64
  • 4.5.2 性能分析64-65
  • 4.6 本章小结65-68
  • 第五章 总结与展望68-70
  • 致谢70-71
  • 参考文献71-76
  • 作者在学期间取得的学术成果76

【参考文献】

中国期刊全文数据库 前1条

1 韩思奇,王蕾;图像分割的阈值法综述[J];系统工程与电子技术;2002年06期



本文编号:749433

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/749433.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户07ec5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com