基于深度学习的视频分类方法研究

发布时间:2024-06-11 01:01
  为了有效管理视频数据和提取视频中的重要信息,视频自动分类技术成为解决这一问题的主要途径。视频数据由图像帧组成,其内部信息的关系结构比较复杂,基于传统手工设计的特征不能有效的表示视频数据中的复杂信息。利用深度学习技术能够提取较为完整的特征信息,提高视频分类的准确率。因此,本文研究了基于深度学习的视频分类方法,主要工作如下:(1)针对定长的视频序列不能完全覆盖视频全部动作信息的问题,提出了基于三维卷积神经网络的特征融合的视频分类方法。该方法在三维卷积网络模型的基础上,提取不同时间尺度的视频帧序列特征,并对全连接层的特征进行加权融合。在数据集UCF101上对不同的融合方法进行比较,实验结果表明,后端加权融合方法的视频分类准确率较高;然后经过实验确定加权融合的参数,从而构建了不同尺度特征融合的视频分类网络模型。实验结果表明,本方法比主流方法更有效的进行视频分类。(2)针对视频语义变化对视频分类结果的影响以及如何提高视频分类过程中类内相似度和类间离散度等问题,提出了一种基于深度度量学习的多路卷积网络视频分类方法。该方法基于不同尺度特征融合的网络模型,设计了一种多路卷积视频分类网络。为了使网络能够...

【文章页数】:60 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 基于传统手工特征的分类方法
        1.2.2 基于深度学习的分类方法
    1.3 主要研究内容及研究路线
        1.3.1 主要研究内容
        1.3.2 研究路线
    1.4 论文组织结构
    1.5 本章小结
2 视频分类相关理论及技术
    2.1 视频分类方法
    2.2 深度神经网络
        2.2.1 卷积神经网络
        2.2.2 循环神经网络
    2.3 度量学习
        2.3.1 度量学习及应用
        2.3.2 度量学习与Softmax
    2.4 本章小结
3 基于三维卷积神经网络的特征融合视频分类方法
    3.1 问题分析
    3.2 不同尺度特征融合的视频分类网络模型设计
        3.2.1 网络模型设计思想
        3.2.2 网络模型的建立
    3.3 实验与结果分析
        3.3.1 实验数据及评价标准
        3.3.2 融合方法的选取
        3.3.3 加权融合的权值选取
        3.3.4 实验结果对比与分析
    3.4 本章小结
4 基于深度度量学习的多路卷积网络视频分类方法
    4.1 问题分析
    4.2 基于多路卷积网络的视频分类方法设计
        4.2.1 网络模型设计思想
        4.2.2 网络模型的建立
    4.3 基于负向样本对语义距离间隔分配的度量学习方法
        4.3.1 网络损失函数的计算
        4.3.2 度量损失的计算
        4.3.3 基于负向样本对语义距离间隔函数的设计
    4.4 实验及结果分析
        4.4.1 多路卷积网络模型的有效性验证
        4.4.2 网络模型各项参数对分类结果影响验证
        4.4.3 实验结果对比与分析
    4.5 本章小结
5 基于多路卷积网络与LSTM的视频分类方法
    5.1 问题分析
    5.2 基于多路卷积网络与LSTM的网络模型设计
        5.2.1 网络模型设计思想
        5.2.2 网络模型的建立
    5.3 实验结果及分析
        5.3.1 网络的有效性验证
        5.3.2 实验结果对比与分析
    5.4 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
致谢
参考文献
附录



本文编号:3992168

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3992168.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户79857***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com