当前位置:主页 > 科技论文 > 自动化论文 >

基于语义分割的行人属性识别技术的研究与实现

发布时间:2024-02-24 00:41
  智慧城市是科技赋予给社会的一个新的名词,而摄像头是建设智慧城市一个重要的基础设备。高效,有效的利用好摄像头信息能够在人们日常生活和维护社会秩序中发挥重要的作用。行人信息在摄像头信息中占有很大的比例,通过摄像头中的行人信息,可以进行行人检索,行人识别和行人重识别。因此,对于行人信息的研究有着很强的现实意义。本文是对自然场景下行人属性信息进行识别。通过总结之前对于行人属性的研究工作,本文发现之前工作主要是探讨行人属性信息的存在性。然而,行人属性的位置信息在行人重识别等领域也有重要的作用,因此本文主要对如何获取行人属性位置信息进行研究。本文利用语义分割模型进行行人属性位置信息的获取。面对当前无可用行人属性语义分割数据集的状况,本文制作了第一个行人属性语义分割数据集。在此数据集基础上,本文利用不同语义分割框架进行实验,首先利用简单的语义分割模型进行可行性验证,验证了可以利用语义分割获取到行人属性的位置信息,之后利用精度更高更复杂的模型训练得出此数据集的miou基准值。针对得到的miou基准值,本文从属性类别、准确率、图片清晰度三个方面与miou进行了相关性分析,得出miou与属性数量占比、准确...

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

图2.2注意力模型网络拓扑

图2.2注意力模型网络拓扑

上部分模型由三个1*1的卷积构成(每一个卷积都带有batch?normalization??和ReLU层),最后的输出为1*1*C?(C为属性的个数)。文中将该输出称作属??性注意力映射w,之后忒,w进行一个空间softmax运算,这步运算使得模型将??资源集中于图片中最相关的区....


图3-1全卷积网络实现图??将全连接层变为全卷积层一定程度上提升了运算效率

图3-1全卷积网络实现图??将全连接层变为全卷积层一定程度上提升了运算效率

北京邮电大学工学硕士学位论文的创新:(1)将原始网络中最后几层全连接层全部变成了卷跃结构,进一步提升了识别准确率。??层??卷积神经网络包括AlexNet、VGG等网络,这些网络对于图的要求,这是因为卷积神经网络在判断图片物体类型时,需几层全连接层,以达到最后一层是一个大小为分类....


图3-3?deep】abv3+模型框架图??1)?Atrous?convolution?原理??

图3-3?deep】abv3+模型框架图??1)?Atrous?convolution?原理??

%?2x?conv?7??图3-2?FCN跳跃结构??图中将C〇nv7使用二进制插值法进行二倍的上采样,之后与P〇〇14的特征矩??阵进行融合,FCN称这种结构为16s。同理,FCN将conv7和pool4的特征分别??使用二进制插值法做4倍和2倍的上采样,将结果与pool3进行....


图3-2?FCN跳跃结构??图中将C〇nv7使用二进制插值法进行二倍的上采样,之后与P〇〇14的特征矩??

图3-2?FCN跳跃结构??图中将C〇nv7使用二进制插值法进行二倍的上采样,之后与P〇〇14的特征矩??

基于?Atrous?convolution?的?Atrous?Spatial?Pyramid?Pooling?(ASPP)。在此基础上,??为了提升运算效率,deeplabv3+米取了?encoder-decoder结构,并且将Xception模??型加入到encoder结构中。....



本文编号:3908241

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3908241.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户985ea***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com