当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的多标签场景图像分类研究

发布时间:2023-05-14 05:11
  场景分类是图像分类的一种特殊情况,它根据图像的视觉内容为图像赋予相应的语义类别,相对于一般的图像分类,场景分类训练的数据集可能较小,且场景分类往往是多标签的,同时类内差异明显,类间又有很多相似性,使得多标签场景图像的有效分类存在诸多挑战。深度学习在识别图像中的对象方面具有非常优异的表现,基于深度学习的图像分类在特定任务上早就超过了人类的平均水平。本文利用深度学习相关神经网络算法良好的特征提取优势,结合多示例多标记学习(MIML)和迁移学习相关理论建立分类模型,给定一组图像,识别图像中包含的场景或对象来对它们进行多标签分类。基于深度神经网络的多示例多标记学习算法,将BP神经网络和RBF神经网络引入到多示例多标记学习框架中,分别建立MIMLNN算法和MIMLRBF算法的分类模型,能够采用非线性函数为标签相关性建模,描述出更为复杂的标签同现关系,同时将标签的相关性反馈到输入来提高系统的性能。与传统的MIML相关算法相比分类效果优势明显,同时通过改进MIMLRBF算法中Hausdorff距离表达,提出改进的W-MIMLRBF算法,进一步提高多标签场景图像分类效果。基于迁移学习的多标签场景图像分...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 研究的主要内容
    1.4 论文的组织结构
第二章 场景图像分类和多标签分类
    2.1 场景图像分类的概念和难点
        2.1.1 场景图像分类的概念
        2.1.2 场景图像分类的难点
    2.2 多标签分类
        2.2.1 多标签分类的定义
        2.2.2 多标签分类算法
        2.2.3 多标签分类的评价标准
    2.3 常见的多标签分类模型
        2.3.1 Softmax回归模型
        2.3.2 K-近邻分类模型
    2.4 本章小结
第三章 深度学习网络模型
    3.1 深度学习
    3.2 深度学习网络模型
        3.2.1 BP神经网络
        3.2.2 RBF神经网络
        3.2.3 卷积神经网络
    3.3 本章小结
第四章 基于深度神经网络的传统与改进MIML算法
    4.1 多示例多标记学习
    4.2 基于BP神经网络的MIML算法
        4.2.1 多层感知机
        4.2.2 MIMLNN算法
    4.3 基于RBF神经网络的MIML算法
    4.4 基于RBF神经网络的改进MIML算法
    4.5 算法实现
        4.5.1 创建MIML图像数据集
        4.5.2 实验结果与分析
    4.6 本章小结
第五章 基于迁移学习的多标签场景图像分类算法
    5.1 迁移学习
    5.2 Inception-V3 模型
    5.3 基于迁移学习的多标签场景图像分类算法
        5.3.1 算法思想
        5.3.2 创建迁移学习数据集
        5.3.3 算法实现
    5.4 实验结果分析
    5.5 本章小结
第六章 结论与展望
    6.1 结论
    6.2 展望
致谢
参考文献
攻读学位期间参加科研情况及获得的学术成果



本文编号:3817251

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3817251.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1c3b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com