基于深度学习的视频行为识别研究与实现

发布时间:2023-03-31 20:28
  人体行为识别在众多场景具有十分广阔的应用前景,随着深度学习成为人工智能发展历程中不可或缺的核心技术,采用深度学习的方法对视频中人体行为识别进行研究与应用具有重要的意义和价值。卷积神经网络(CNN)作为深度学习的一种代表算法,在计算机视觉领域,如图像识别与目标检测等任务中取得了成功的应用,视频相较于图像增加了时间维度,并且视频数据格式多样,如何利用CNN有效的学习视频中人体行为的时序信息,目前仍值得进行深入研究和探讨。因此,采用CNN对视频行为识别算法进行研究和改进,针对多种视频数据格式的行为识别问题提出和实现了对应的方案,同时,为探索和推动行为识别技术面向实际应用,实现了一种监控视频场景下的行为识别系统,对视频中的人体行为进行自动识别。主要内容及创新包括:1.针对深度视频,首先采用空间结构动态深度图技术,将视频映射压缩到二维空间作行为表征,然后考虑到该表征抽象层次较低,为对该表征进行更充分的特征学习和抽象,设计了具有联合监督的卷积神经网络,提高网络的类内聚合和类间分离能力,同时该网络的设计还充分的考虑到小样本情况下训练过程容易过拟合的情况。2.针对RGB视频,提出了基于时空注意力与自适...

【文章页数】:69 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 基于深度视频的人体行为识别研究现状
        1.2.2 基于RGB视频的人体行为识别研究现状
    1.3 本文主要工作及创新点
        1.3.1 本文章节安排
        1.3.2 本文主要创新点
第二章 深度学习理论基础
    2.1 卷积神经网络的理论基础
        2.1.1 卷积层
        2.1.2 池化层
        2.1.3 全连接层
        2.1.4 损失函数
        2.1.5 激活函数
    2.2 神经网络优化方法
        2.2.1 梯度下降法
        2.2.2 误差反向传播算法
    2.3 本章小结
第三章 基于深度视频的人体行为识别研究
    3.1 行为表征方法
        3.1.1 双向排序池化原理
        3.1.2 空间结构动态深度图
    3.2 基于联合监督的卷积神经网络
        3.2.1 网络结构设计
        3.2.3 联合损失函数
    3.3 实验与结果分析
        3.3.1 网络训练与参数设置
        3.3.2 识别结果与分析
    3.4 本章小结
第四章 基于RGB视频的人体行为识别研究
    4.1 TSN总体结构
    4.2 基于时空注意力与自适应融合的网络
        4.2.1 特征提取网络
        4.2.2 时空注意力模块
        4.2.3 自适应融合模块
    4.3 实验与结果分析
        4.3.1 数据集
        4.3.2 网络训练及参数设置
        4.3.3 结果分析
    4.4 本章小结
第五章 行为识别系统的设计与实现
    5.1 系统概述
    5.2 识别算法
        5.2.1 自建数据集与模型训练
        5.2.2 在线行为识别算法
    5.3 实验与分析
        5.3.1 识别算法实验及分析
        5.3.2 系统整体实验及分析
    5.4 本章小结
第六章 总结与展望
    6.1 论文总结
    6.2 工作展望
致谢
参考文献
攻读硕士期间取得的研究成果



本文编号:3775737

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3775737.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户d5c8e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]