基于ZYNQ的卷积神经网络软硬件协同设计研究与实现

发布时间:2024-03-16 01:44
  卷积神经网络作为深度学习领域的核心算法,将特征提取与分类进行结合,与人工提取特征进行分类相比,具有更高的检测精度。由于其网络结构复杂,每层包含大量并行的乘加运算,需要硬件平台具有强大的并行计算能力。FPGA作为一种可编程逻辑器件,具有高并行度和可编程性等优势,可针对不同的算法进行并行加速,成为实现卷积神经网络的一种重要的选择。本文基于Xilinx公司的ZYNQ芯片对卷积神经网络进行硬件加速研究。对卷积神经网络的结构特点进行分析,采用软硬件协同设计的方式,充分发挥ARM和FPGA的优点。ARM端完成Linux操作系统的移植以及软硬件协同程序的设计;FPGA端实现卷积计算模块、深度可分离卷积计算模块、池化计算模块、数据输入和输出模块的设计。针对并行展开的方式易造成长广播、多扇入扇出的数据通路问题,本文采用脉动阵列代替并行展开,将长距离的数据通路转换为每个处理单元之间的短距离数据通路,并完成卷积计算模块的设计工作。在数据传输的实现方式上,采取多通道数据传输加中间缓存的方式,减少数据在DDR存储器和片上缓存之间传输的时间,并完成对数据输入和输出模块的设计。在硬件IP优化上,采用乒乓流水化操作方...

【文章页数】:76 页

【学位级别】:硕士

【部分图文】:

图2.1?LeNet-5卷积神经网络结构图[s]??Fig.?2.1?LeNet-5?Convolutional?Neural?Network?structure?diagram??

图2.1?LeNet-5卷积神经网络结构图[s]??Fig.?2.1?LeNet-5?Convolutional?Neural?Network?structure?diagram??

机器学习算法进行对图像进行识别。虽然SIFT??对一定程度上的缩放、平移、旋转等变化都具有不变性,但由于是人工进行特征提取,??所得到出的特征具有很大程度上的局限性。卷积神经网络将特征提取与分类训练两个部??分进行组合,在网络的训练过程中就会自动的提取最有效的特征,避免了人工提取....


图2.2卷积计算过程??Fig.?2.2?Convolution?calculation?process??-9?-??

图2.2卷积计算过程??Fig.?2.2?Convolution?calculation?process??-9?-??

?6?5?1?3?8?〇?0?1????7?|?4?3?|?9?5?|?1?〇?1?I?????39^?29?52??????48?42?43??4?7?3?1?6??????.?令?45?53?43??2?411!?—7」i????(x)-*??5?7?0?3?2?Oil??4....


图2.4最大池化与平均池化??Fig.?2.4?Max-pooling?and?Mean-pooling??

图2.4最大池化与平均池化??Fig.?2.4?Max-pooling?and?Mean-pooling??

况[22]??Tab.?2.1?MobileNet?versus?GoogleNet/VGG?16??网络名称?TmageNet准确度(%)?乘法计算量(M)?参数量(M)??MobileNet?70.6?569?4.2??GoogleNet?69.8?1550?6.8??VGG....


图3.1?ZYNQ芯片结构图??Fig.?3.1?Tlie?structure?diagram?of?ZYNQ?chip??ZYNQ芯片结构如图3.1所示

图3.1?ZYNQ芯片结构图??Fig.?3.1?Tlie?structure?diagram?of?ZYNQ?chip??ZYNQ芯片结构如图3.1所示

?v'm&rvuplCsfw?L.,.?二??with?DMA?..-2^?-?|??2xGigE?t?t?t?t?|??LrTv_.?t?t?i?l?——?^??EM,〇?XADC?S.AXLGPO/1?M.AXLGPO/1?PCle??^??,卞?u??Multi-Stand....



本文编号:3928926

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3928926.html

上一篇:北斗二代中频信号仿真与捕获算法研究  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户77e05***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]