当前位置:主页 > 科技论文 > 自动化论文 >

适用于CNN的高能效可配置卷积加速器的设计与实现

发布时间:2023-03-04 10:41
  计算机视觉在当今工业物联网中发挥着重要的作用,而图像识别是计算机视觉中最重要的部分之一,卷积神经网络算法由于其较高的识别精度成为图像识别的首选。在很多图像识别应用中,由于对实时性有一定要求,所以神经网络的推理需要在本地硬件上执行,如无人机的碰撞检测等。并且由于GPU功耗较高,限制了其在功耗与资源有限的嵌入式平台上使用,因此需要一种高能效、可配置的卷积加速器来满足卷积神经网络算法在嵌入式平台上的应用需求。本文从卷积层的运算模型出发,分析了不同存储结构的能耗以及卷积层运算中多种数据复用方式,并结合二维计算单元阵列,提出了一种针对卷积层运算的卷积加速器架构。首先,采用了一种可配置的计算单元阵列,实现了与卷积运算映射的高度匹配,显著提高了计算单元利用率;然后,设计了一种带有本地存储并支持交错运算的计算单元,实现了计算单元对输入特征图的复用和中间结果的累加,明显减少了对输入特征图和卷积核数据的片外存储访问;最后,基于树型网络,设计了一种支持数据流处理的专用片上网络,实现了计算单元阵列对输入特征图和卷积核的数据共享以及中间结果的传输,满足了计算单元阵列与全局缓存之间的数据传输需求。本文首先基于硬件...

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 本文内容安排
2 卷积层运算模型分析
    2.1 卷积层运算模型
    2.2 存储模式分析
    2.3 卷积层数据复用类型分析
    2.4 实现多种数据复用的结构
    2.5 本章小结
3 卷积加速器的设计与实现
    3.1 系统整体架构及数据定点化
    3.2 数据流的实际处理
    3.3 系统模块的实现
    3.4 本章小结
4 卷积加速器的验证与结果分析
    4.1 卷积加速器的功能仿真
    4.2 卷积加速器的FPGA验证及ASIC实现
    4.3 系统测试与结果分析
    4.4 不同卷积层参数下计算单元使用率分析
    4.5 本章小结
5 总结与展望
6 致谢
参考文献
附录 1 攻读硕士期间的科研工作



本文编号:3754138

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3754138.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aa0f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com