当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的字符级场景汉字检测与识别问题研究

发布时间:2024-01-14 11:34
  文字承载着各个国家的文化与文明,也是人类交流的载体。如今随着多媒体时代的发展,文字的表现形式也愈加丰富。中国的汉字历史悠久、字体形式多变,演变至今不仅具备文学研究意义,同时为计算机视觉领域提供丰富的研究课题。尤其在自然场景图片中,文本的内容拥有丰富的语义信息,研究人员可以通过对这些文字的阅读和理解提取到相关重要的信息,用于如文献检索、城市监控、无人驾驶、医学治疗等工业应用。目前传统的光学字符识别(Optical Character Recognition,OCR)技术在文档分析中已有广泛的应用且识别效果显著。与传统印刷体不同,自然场景中的文字不仅字体样式多变,背景也较为复杂,然而目前的算法多针对英文,难以应对场景汉字的复杂性。场景汉字的检测识别仍是一项具有挑战的研究工作,因此本文针对场景汉字的检测与识别任务做了如下工作:1.本文针对现有检测算法在中文应用上的不足,提出一种基于多尺度特征与多目标函数的场景文本检测算法。同时适用于文本行和字符的检测,和现有方法相比具有多方面的优势。具体的网络设计如下:(1)多尺度特征提取网络。借鉴语义分割的思想,在调整后的骨干网络Res Net-50后接入...

【文章页数】:86 页

【学位级别】:硕士

基于深度学习的字符级场景汉字检测与识别问题研究


基于深度学习的字符级场景汉字检测与识别问题研究


基于深度学习的字符级场景汉字检测与识别问题研究



本文编号:3878151

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3878151.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户efad2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com