当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的食品自动识别算法研究

发布时间:2023-04-22 15:37
  科技的快速发展极大提升人们的日常生活水平,食品自动识别作为计算机视觉领域在真实场景下的重要应用之一是当前的研究热点。食品自动识别不仅能够用于自动计价,增加结算窗口,降低人力资源损耗,有效减少顾客排队等候时间,还可以用于顾客的饮食偏好分析。后续能够通过大数据分析此区域的饮食习惯,对库存管理起指导作用,同时也能够进行顾客自身的摄食营养分析,帮助顾客合理膳食,避免代谢性疾病的产生。在食品自动识别算法中,传统的图像处理和机器学习方法存在许多不足。大部分研究基于食品分类任务,在实际场景中此类方法容易受到光照强度、噪声干扰、位置方向等因素的影响。随着深度学习的发展,卷积神经网络在图像识别、目标检测、语义分割等领域获得巨大的成功,食品识别技术也逐渐围绕卷积神经网络展开研究。但在食品识别实际落地的过程中,发现存在样本标记获取成本高,食品类别增加模型更新周期长,识别速度较慢等问题。本文致力于解决以上问题,研究实际食堂应用计费场景中的碗碟检测以及菜品识别,主要工作包括以下几个方面:(1)构建并开源国内外首个真实场景下的碗碟数据集Bowl-10和Bowl-95,数据集用于碗碟目标检测研究。Bowl-10数据...

【文章页数】:82 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
主要英文缩写词表
1 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 食品识别传统方法研究现状
        1.2.2 食品识别深度学习方法研究现状
        1.2.3 食品识别难点
    1.3 论文主要研究内容
    1.4 论文结构安排
2 相关技术及理论
    2.1 深度学习概述
    2.2 卷积神经网络结构
        2.2.1 卷积层
        2.2.2 池化层
        2.2.3 全连接层
        2.2.4 激活函数
        2.2.5 反向传播和梯度下降算法
    2.3 目标检测
        2.3.1 传统目标检测方法
        2.3.2 基于深度学习的目标检测方法
    2.4 CNN在食品识别中的应用
    2.5 本章小结
3 基于跨连Faster R-CNN的碗碟检测
    3.1 引言
    3.2 碗碟检测数据集
        3.2.1 Bowl-10数据集
        3.2.2 Bowl-95数据集
    3.3 可视化Faster R-CNN
        3.3.1 特征图可视化
        3.3.2 卷积核可视化
        3.3.3 梯度加权类激活映射
    3.4 跨连Faster R-CNN模型
    3.5 实验结果与分析
        3.5.1 实验环境
        3.5.2 评价指标
        3.5.3 实验分析
    3.6 本章小结
4 基于深度卷积神经网络的食品识别
    4.1 引言
    4.2 食品识别数据集
        4.2.1 CNFood-252 数据集
        4.2.2 Few Food-50 数据集
    4.3 食品图像半监督标记与粗增强
        4.3.1 食品图像半监督标记
        4.3.2 食品图像粗增强
    4.4 食品图像定位和分类
    4.5 食品图像匹配
        4.5.1 少样本学习
        4.5.2 度量学习
        4.5.3 模型设计
    4.6 实验结果与分析
    4.7 本章小结
5 总结与展望
    5.1 论文总结
    5.2 展望
参考文献
攻读硕士学位期间取得的研究成果
致谢



本文编号:3797923

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3797923.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ed7b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com