当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的汉字识别技术研究

发布时间:2022-12-18 00:28
  汉字图像识别是模式识别研究与应用领域的一个重要分支,在经济贸易、智能交通、文字印刷等许多领域有着极其广泛的应用。因此,汉字识别方法的技术研究与开发越来越受到人们的重视,现今已经成为世界范围内热门研究的课题之一。随着深度学习在人工智能领域中的快速发展,深度学习中的卷积神经网络已经在模式识别中获得了优秀的识别性能。针对传统汉字识别受特征提取方法的限制,深度学习中的卷积神经网络便发挥了可以自动获取学习样本特征的优势,但是深度学习在训练样本时比较复杂所以难度较大。本文通过结合卷积神经网络以及传统模式识别在汉字识别的应用进行了相关的研究,论文主要研究工作如下:1)本文研究了传统汉字图像识别方法,使用支持向量机加决策树作为分类器,分别使用方向特征、Gabor特征以及弹性网格特征加上三种不同的数据集预处理方法进行试验。实验表明使用形态学转换的数据集预处理方法加上使用弹性网格特征,能够获得较好的识别准确率。2)为了解决形相似汉字的微小差异会在训练中丢失的问题,通过将注意力层与本文选定的AlexNet网络中的卷积层进行并联,以提高汉字图像中微小差异处的权重,达到提高该处注意力的目的,从而减少卷积层对于丢... 

【文章页数】:73 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题研究背景及意义
    1.2 国内外研究现状
        1.2.1 传统的汉字识别
        1.2.2 基于深度学习的汉字识别
    1.3 论文主要内容和组织结构
第2章 传统汉字图像识别方法
    2.1 汉字识别的流程
    2.2 预处理
        2.2.1 图像二值化
        2.2.2 图像平滑
        2.2.3 形态学转换
        2.2.4 规整化
    2.3 特征提取
        2.3.1 方向特征
        2.3.2 Gabor特征
        2.3.3 弹性网格
    2.4 图像分类方法
        2.4.1 决策树算法
        2.4.2 提升算法
        2.4.3 支持向量机
    2.5 本章小结
第3章 基于卷积神经网络的图像识别
    3.1 卷积神经网络结构
        3.1.1 局部感知区域与权值共享
        3.1.2 激励函数
        3.1.3 局部响应归一化
        3.1.4 池化
        3.1.5 Dropout
    3.2 卷积神经网络的前向传播
        3.2.1 卷积层的前向传播
        3.2.2 池化层的前向传播
        3.2.3 全连接层的前向传播
        3.2.4 Softmax层的前向传播
    3.3 卷积神经网络的反向传播
        3.3.1 Softmax层的反向传播
        3.3.2 全连接层的反向传播
        3.3.3 池化层的反向传播
        3.3.4 卷积层的反向传播
    3.4 本章小结
第4章 集成注意力层的卷积神经网络在汉字识别上的应用
    4.1 研究目的与总体思路
    4.2 基准模型选取
        4.2.1 模型设计
        4.2.2 实验
    4.3 AlexNet详解
    4.4 基于注意力层的卷积神经网络
        4.4.1 注意力层原理
        4.4.2 集成注意力层的卷积神经网络
    4.5 本章小结
第5章 汉字图像识别实验
    5.1 实验平台搭建
        5.1.1 GPU架构设计
        5.1.2 数据交互
        5.1.3 软件设计
    5.2 数据集
        5.2.1 数据集介绍
        5.2.2 数据增强
    5.3 汉字图像识别实验
        5.3.1 实验一:传统汉字识别试验方法对比
        5.3.2 实验二:汉字图像分辨率对比
        5.3.3 实验三:训练样本数量对比
        5.3.4 实验四:网络结构对比
        5.3.5 实验五:网络性能优化
    5.4 本章小结
第6章 总结与展望
    6.1 本文的主要工作
    6.2 未来工作的展望
参考文献
攻读学位期间发表的论文
致谢


【参考文献】:
期刊论文
[1]一种基于CNN手写字符识别的改进方法[J]. 高灿.  黑龙江科技信息. 2017(03)
[2]基于GPU的卷积检测模型加速[J]. 刘琦,黄咨,陈璐艳,胡福乔.  计算机应用与软件. 2016(05)
[3]基于方向线素特征的手写体维文字符识别[J]. 姜文,卢朝阳,李静.  微电子学与计算机. 2013(10)
[4]基于手写体汉字双弹性网格模糊特征的研究[J]. 魏玮,郭向丹.  控制工程. 2012(06)
[5]手写体汉字识别的二叉树SVM算法研究[J]. 朱程辉,项思俊.  计算机技术与发展. 2009(09)
[6]基于二元树复数小波变换的文种自动识别[J]. 朱华光,平西建,程娟.  数据采集与处理. 2008(06)
[7]基于Gabor变换的高鲁棒汉字识别新方法[J]. 王学文,丁晓青,刘长松.  电子学报. 2002(09)
[8]一种基于支持向量机的手写汉字识别方法[J]. 高学,金连文,尹俊勋,黄建成.  电子学报. 2002(05)
[9]基于多尺度小波纹理分析的文字种类自动识别[J]. 曾理,唐远炎,陈廷槐.  计算机学报. 2000(07)
[10]一种基于灰度期望值的图象二值化算法[J]. 高永英,张利,吴国威.  中国图象图形学报. 1999(06)

博士论文
[1]降维算法和手写文字识别中若干问题研究[D]. 姚超.西安电子科技大学 2014

硕士论文
[1]基于深度学习的字符识别[D]. 张超群.电子科技大学 2016
[2]基于CPU-GPU异构平台的图像处理的加速研究[D]. 宋展.西安电子科技大学 2014
[3]深度学习及其在手写汉字识别中的应用研究[D]. 王有旺.华南理工大学 2014
[4]维吾尔文单字符Gabor特征提取与识别[D]. 姜文.西安电子科技大学 2012
[5]基于大字符集脱机手写体汉字识别方法研究[D]. 周双飞.苏州大学 2011
[6]基于图像匹配的汉字识别系统研究与实现[D]. 武桐.上海交通大学 2010



本文编号:3720957

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3720957.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a9668***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com