微处理器存储体系结构优化关键技术研究

发布时间:2024-05-31 05:25
  大数据时代的来临加剧了本就已很严重的存储墙、带宽墙以及功率墙问题,也使得当前的计算机系统在处理相关的数据密集型应用时,存储系统往往会成为整个系统的性能瓶颈。近年来一些针对性的存储优化技术以及新型存储结构、介质等为存储结构的发展提供了可能性。本文面向存储结构中真实存在的各种问题,围绕从各方面对存储结构进行优化来展开,基于不同存储结构的优势与不足,针对性的设计优化框架来提高存储系统的性能;通过合理的利用新型存储结构的存储内计算特性,以全新的视角探究将存储系统作为加速器的可能性。在目前通用存储系统以及新型存储结构的框架下,本文重点解决三个问题:如何在当前多级复杂存储结构的框架下充分挖掘预取技术的潜力;如何在目前DRAM可扩展性已经乏力且新型存储结构存储容量并无很大提高的情况下,通过压缩技术增大其有效容量;如何合理的利用当前新型三维存储结构的逻辑层进行存储内计算,针对某类重要应用进行加速。本文取得的主要研究成果如下:1.提出了一种面向多层存储结构的优化预取效率方法CHAM(Composite Hierarchy-Aware Method for improving Prefetch Effic...

【文章页数】:175 页

【学位级别】:博士

【部分图文】:

图1.1存储墙问题示意图

图1.1存储墙问题示意图

多核众核处理器的处理能力的快速稳定增长需要存储带宽以同步的速度跟上。但很遗憾的是,存储单元的处理速度提升始终没有跟上处理器的处理速度提升,这也就造成了所谓的存储墙问题。现代的数据中心处理的巨额数据量也加剧了存储系统上的压力,如今的SRAM-DRAM存储系统结构已经几乎无法满足了。....


图5.12HMCSP在随机的十个稀疏矩阵上运行访存延迟的比较

图5.12HMCSP在随机的十个稀疏矩阵上运行访存延迟的比较

为了全面的测试不同类型的稀疏矩阵,我们在HMCSP上测试了10个案例。这10个稀疏矩阵的行列数以及稀疏指数都是随机的,因此这些例子基本覆盖了各种情况。从图5.12中可以看出,对于不同种类的稀疏矩阵,平均HMCSP可以有效地降低49.7%的传输延迟。这是由于HMC的PIM能力可以用....


图5.13HMCSP在随机的十个稀疏矩阵上性能的比较

图5.13HMCSP在随机的十个稀疏矩阵上性能的比较

图5.12HMCSP在随机的十个稀疏矩阵上运行访存延迟的比较图5.13展示了HMCSP作用在基于CSR的SPMV的性能。SPMV是一种典型的访存密集型的应用程序,访存指令的拥塞很大程度上影响了总体性能。由于HMCSP减少了访存指令并良好利用了延迟更短的原子计算操作,CSR-SP....


图5.14在不同系数矩阵大小以及稀疏系数的情况下HMCSP的传输延迟比较

图5.14在不同系数矩阵大小以及稀疏系数的情况下HMCSP的传输延迟比较

对于矩阵参数的分析主要涉及到矩阵大小以及矩阵稀疏指数。图5.14(a)展示了在固定矩阵稀疏系数的情况下改变不同行列的性能变化。图中的五个应用程序从左到右矩阵大小在增加,可以看出,随着矩阵大小的增加,HMCSP效率越来越高。将案例1与案例5比较的话,可以看出案例5比案例1多减少了3....



本文编号:3985178

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3985178.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户63c94***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com