倾斜文档校正方法的研究与实现

发布时间:2023-12-13 19:24
  随着电子文档的使用也越来越广泛,大量的历史文档需要通过打印机扫描为电子文档,但是在扫描过程中会由于人为或者其他原因导致文档倾斜,倾斜的文档给后续的文字分割,文字识别以及读者阅读都带来了不便。针对上述问题,已经很多学者对此进行研究并提出了很多优秀的倾斜校正算法,主要包括基于霍夫变换的方法,基于投影的方法,基于最近邻的方法等。在这些算法中,虽然有些检测倾斜角度的精度很高,但是计算量却很大;有些算法则是为了提高算法运行速度而牺牲了算法的性能。因此,本文为了解决上述方法的弊端,提出了两种不同的倾角检测算法。第一种算法是基于边界框,概率模型和Q检验法的文档倾斜校正方法。此算法首先用边界框筛选出符合条件的有效连通域;然后参考概率模型计算出几个可能的文档斜率值;最后使用Q检验法和投影法来计算最佳的文档倾斜角度并进行旋转校正。第二种算法是利用整个文档的最小面积矩形边界框和投影法相结合来进行文档校正。此算法首先将图像进行预处理和降采样;然后通过整个文档的最小面积的矩形边界框来求出文档倾斜的近似角度;最后在此近似角度的邻域内使用投影法来计算出最终文档倾角并进行图像的旋转校正。实验结果与分析表明,本文提出的...

【文章页数】:98 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 主要研究内容
    1.3 本文主要创新点
    1.4 论文组织结构
2 文档倾斜校正流程概述
    2.1 文档图像简介
        2.1.1 数字图像介绍
        2.1.2 文档特征分析
    2.2 文档倾斜检测与纠正流程
    2.3 文档图像预处理
        2.3.1 文档图像二值化
        2.3.2 文档图像去噪
        2.3.3 文档图像形态学操作
    2.4 本章小结
3 相关研究工作
    3.1 文档倾斜角度检测算法
        3.1.1 投影法
        3.1.2 霍夫变换法
        3.1.3 近邻法
        3.1.4 傅里叶变换法
        3.1.5 其他方法
    3.2 倾斜文档旋转校正方法
        3.2.1 最近邻插值法
        3.2.2 双线性插值法
        3.2.3 双三次插值法
    3.3 本章小结
4 基于概率模型与Q检验的倾斜校正研究
    4.1 基本理论
        4.1.1 概率模型
        4.1.2 Q检验法
    4.2 算法流程与分析
        4.2.1 文档图像预处理
        4.2.2 有效连通域筛选
        4.2.3 基于概率模型的倾斜斜率计算
        4.2.4 基于Q检验与投影法的倾角计算
        4.2.5 基于最近邻插值法的旋转校正
    4.3 实验结果与分析
    4.4 本章小结
5 基于最小面积边界框与投影法的倾斜校正研究
    5.1 基本理论
        5.1.1 整个文档图像矩形边界框
    5.2 算法流程与分析
        5.2.1 文档图像预处理
        5.2.2 文档图像缩小
        5.2.3 基于最小面积矩形边界框的近似倾角计算
        5.2.4 基于投影法的最终倾角计算
        5.2.5 文档图像旋转校正
    5.3 实验结果与分析
    5.4 本章小结
6 实验结果分析与对比
    6.1 数据集与实验平台介绍
    6.2 评价标准
        6.2.1 性能评价标准
        6.2.2 效率评价标准
    6.3 重要参数选取
    6.4 算法性能与效率对比分析
        6.4.1 精确度对比分析
        6.4.2 算法运行时间对比
    6.5 本章小结
7 总结与展望
    7.1 研究工作总结
    7.2 未来研究方向展望
参考文献
攻读学位期间发表的学术成果
攻读学位期间参与项目
致谢



本文编号:3873817

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3873817.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户98682***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com