当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的RGB-D图像语义分割方法研究

发布时间:2023-08-17 20:10
  图像的语义分割是图像理解的基石,近年来随着深度学习的飞速发展,使用深度学习的图像语义分割技术成为计算机视觉领域中备受关注的研究课题。卷积神经网络是重要的深度学习方法,近年来在图像语义分割任务中表现优异。随着RGB-D图像摄取设备的普及,越来越多的图像分析任务中加入了深度信息。因此本文介绍一种基于卷积神经网络的RGB-D图像语义分割方法,并在此基础上进行改进,主要工作如下:(1)分析了基于卷积神经网络融合颜色和深度信息的图像语义分割方法,同时研究了此方法中颜色信息和深度信息的融合原理和两种融合方式。该对称的编码解码式网络模型将两种信息的优势相结合,在一定程度上解决了原语义分割网络模型不能充分利用图像颜色和深度信息的问题。(2)针对卷积神经网络中卷积和下上采样等计算导致分割时边缘不清,分割不精确的问题,本文提出使用全连接条件随机场对RGB-D语义分割网络模型进行改进,其中全连接条件随机场的一元势函数使用RGB-D语义分割网络模型的输出进行计算,全连接条件随机场的二元势函数使用原始输入RGB图像计算,然后将两者结合得出精细的语义分割结果,进一步解决模型不能充分利用像素间关系,分割边界不清等问...

【文章页数】:68 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 传统图像语义分割研究现状
        1.2.2 基于深度学习的图像语义分割研究现状
        1.2.3 基于RGB-D图像的语义分割研究现状
    1.3 论文的研究内容及结构
        1.3.1 论文研究内容
        1.3.2 论文组织结构
第二章 基于深度学习的图像语义分割相关理论
    2.1 深度学习和神经网络
        2.1.1 深度学习
        2.1.2 神经网络
    2.2 基于全卷积神经网络的图像语义分割方法
        2.2.1 卷积神经网络
        2.2.2 基于全卷积神经网络的图像语义分割方法
    2.3 基于编码-解码方式的图像语义分割方法
    2.4 本章小结
第三章 基于VGG-16的RGB-D图像语义分割方法
    3.1 VGG-16 网络结构
    3.2 基于VGG-16 编码解码式RGB-D图像语义分割方法
        3.2.1 基于VGG-16 编码解码式RGB-D图像语义分割方法原理
        3.2.2 基于VGG-16 编码解码式RGB-D图像语义分割方法网络结构
    3.3 网络模型融合层原理及策略
        3.3.1 网络模型融合层原理
        3.3.2 网络模型融合层融合策略
    3.4 本章小结
第四章 基于VGG-16的RGB-D图像语义分割方法改进
    4.1 全连接条件随机场模型
        4.1.1 全连接条件随机场模型原理
        4.1.2 全连接条件随机中平均近似场推断
    4.2 改进的RGB-D图像语义分割方法
        4.2.1 改进的RGB-D图像语义分割方法原理
        4.2.2 改进的RGB-D图像语义分割方法网络模型
    4.3 本章小结
第五章 对比实验和结果分析
    5.1 实验环境及框架
        5.1.1 实验环境
        5.1.2 实验框架
    5.2 实验数据集及评估标准
        5.2.1 实验数据集及预处理
        5.2.2 实验评估标准
    5.3 实验及结果分析
        5.3.1 基础RGB-D图像语义分割方法实验分析
        5.3.2 基础RGB-D图像语义分割方法和其他方法对比实验分析
        5.3.3 基础RGB-D图像语义分割方法和改进方法对比实验分析
    5.4 本章小结
第六章 总结与展望
    6.1 论文总结
    6.2 工作展望
参考文献
攻读硕士期间取得的研究成果
致谢



本文编号:3842503

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3842503.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户74b30***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com