当前位置:主页 > 科技论文 > 计算机论文 >

面向移动终端的残差网络加速器设计

发布时间:2024-02-25 11:53
  残差网络(Residual Network,Res Net)因在图像分类、对象检测等领域中表现出优异的成绩而被广泛应用.但是由于Res Net模型结构的高度不规则和复杂度,使得其在移动终端的部署仍是一个具有挑战性的工作.本文设计一种基于现场可编程门阵列(Field Programmable Gate Array,FPGA)的残差网络硬件加速器.首先,采用k-means聚类算法对网络参数进行量化,降低参数的存储需求.其次,通过流水线和并行计算策略实现各计算单元的加速计算,并通过残差计算单元的复用降低对计算资源的需求.所提出的加速器能够有效地在Zynq-ZCU102上实现Res Net,其系统时钟可达到300MHz,延时为26.47ms,DSP占用率为60.4%,LUTRAM占用率为4%.

【文章页数】:5 页

【部分图文】:

图1残差块结构图

图1残差块结构图

对于经典的CNN,在不断增加神经网络的深度时,模型的精度会先上升达到饱和,此时再继续增加深度则会导致精度下降[1].针对这个问题,残差网络引入残差结构,即残差块.残差块所起到的效果就是在网络模型精度已达到饱和之后,再增加的层只是起到层与层之间的恒等映射作用,这样就不会因误差增加而....


图2具有6个残差块的残差网络

图2具有6个残差块的残差网络

定义残差块的形式是y=F(x,W)+x,x,y分别是残差块的输入向量和输出向量.F(x,W)是需要学习的残差映射.残差函数F的形式是灵活的,如对于图1中的标准残差块,其残差映射为F=W2σ(W1x),其中W1,W2分别为残差块中第1层和第2层的权重参数,σ为线性整流函数(Rect....


图3ResNet硬件实现的整体架构

图3ResNet硬件实现的整体架构

ResNet的硬件实现如图3所示,包括以下模块:输入数据缓冲器、权重缓冲器、卷积计算单元、残差计算单元、全连接层计算单元、控制器和输出数据缓冲器组成.4.1参数量化


图4卷积计算模块结构图

图4卷积计算模块结构图

卷积层的计算过程是通过卷积核遍历二维离散信号,将输入特征图的数值与卷积核对应位置的数值相乘并累加,得到输出结果.图4为卷积核为3×3的卷积计算单元的结构.卷积计算单元主要由数据缓冲器、权重缓冲器、乘法器组、加法树、激活函数模块和池化模块组成.在每次卷积时,首先将特征图数据加载到数....



本文编号:3910269

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3910269.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户2b753***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com