基于深度学习的字符级场景汉字检测与识别问题研究

发布时间：2024-01-14 11:34

　　文字承载着各个国家的文化与文明,也是人类交流的载体。如今随着多媒体时代的发展,文字的表现形式也愈加丰富。中国的汉字历史悠久、字体形式多变,演变至今不仅具备文学研究意义,同时为计算机视觉领域提供丰富的研究课题。尤其在自然场景图片中,文本的内容拥有丰富的语义信息,研究人员可以通过对这些文字的阅读和理解提取到相关重要的信息,用于如文献检索、城市监控、无人驾驶、医学治疗等工业应用。目前传统的光学字符识别(Optical Character Recognition,OCR)技术在文档分析中已有广泛的应用且识别效果显著。与传统印刷体不同,自然场景中的文字不仅字体样式多变,背景也较为复杂,然而目前的算法多针对英文,难以应对场景汉字的复杂性。场景汉字的检测识别仍是一项具有挑战的研究工作,因此本文针对场景汉字的检测与识别任务做了如下工作:1.本文针对现有检测算法在中文应用上的不足,提出一种基于多尺度特征与多目标函数的场景文本检测算法。同时适用于文本行和字符的检测,和现有方法相比具有多方面的优势。具体的网络设计如下:(1)多尺度特征提取网络。借鉴语义分割的思想,在调整后的骨干网络Res Net-50后接入...

【文章页数】：86 页

【学位级别】：硕士

本文编号：3878151

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3878151.html

上一篇：基于网络表示学习的链路预测算法研究
下一篇：基于深度学习的癫痫病发作识别研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|