当前位置:主页 > 科技论文 > 计算机论文 >

高性能低能耗GPGPU计算技术研究

发布时间:2024-02-18 01:01
  高性能计算是科学和工程领域的关键基础技术,致力于研究和开发高性能计算机相关的硬件体系结构及软件技术。高性能计算的技术被广泛应用于各个领域如云计算、大数据处理及物联网等以提高实验规模和效率,推动各个领域取得突破性进展。世界超级计算机五百强等排名是各国高性能计算研究实力乃至于综合国力的体现。高性能计算机系统可根据硬件分为同构系统和异构系统,由CPU和GPU(Graphics Processing Unit)等不同种类处理器构成的系统为异构系统,在性能和能效方面具备优势。基于CPU和GPU异构架构的高性能计算技术称为GPU高性能计算,是当前的一个热门研究领域。本文以提高GPU高性能计算的能效和性能,拓展其应用为目标,从体系结构研究、系统软件研究和应用研究这三个层次上提出一些软硬件新技术。本文的第一部分工作提出高能效的新GPU处理器架构。近年来,GPU以其高并行度、高能效和高访存带宽的优势,被广泛部署在超级计算机、数据中心及科研平台上用于加速各种科学计算。大型计算机系统的高能耗一直是研究者们努力解决的问题。GPU处理器中负责处理指令的前端部件是处理器中较为耗能的部件之一。我们提出将GPU内的多...

【文章页数】:124 页

【学位级别】:博士

【文章目录】:
摘要
ABSTRACT
缩略语
第一章 绪论
    1.1 GPU高性能计算简介
        1.1.1 GPU高性能计算研究分类
    1.2 GPU高性能计算软硬件平台介绍
        1.2.1 GPU硬件体系结构
        1.2.2 GPU编程模型及软件开发平台
    1.3 研究内容和创新点
    1.4 国内外研究现状
        1.4.1 高能效GPU新架构研究
        1.4.2 GPU上的不规则应用及负载均衡研究
        1.4.3 GPU上的图算法及图处理系统研究
    1.5 论文的组织和结构
第二章 高能效GPU处理器架构Buddy SM
    2.1 研究背景及简介
    2.2 GPU前端介绍
        2.2.1 前端的构成
        2.2.2 指令发射机制
    2.3 Buddy SM架构
        2.3.1 架构总览
        2.3.2 指令发射
        2.3.3 统一线程块分配
        2.3.4 建立共享
        2.3.5 解除共享
        2.3.6 重建共享
        2.3.7 共享群的通信
        2.3.8 自适应共享群
    2.4 实验方法
        2.4.1 模拟器配置
        2.4.2 功率和面积的开销
        2.4.3 测试集
    2.5 实验结果和分析
        2.5.1 共享时间百分比
        2.5.2 重建共享策略的比较
        2.5.3 自适应共享群方法的性能评估
        2.5.4 Buddy SM的影响
        2.5.5 性能比较
        2.5.6 前端的节能
        2.5.7 整个GPU的节能
    2.6 本章小结
第三章 高性能GPU系统软件CUIRRE
    3.1 研究背景及简介
    3.2 不规则循环和线程级负载不均衡
        3.2.1 不规则应用的特征化
        3.2.2 GPU资源利用率
    3.3 线程级负载均衡的任务池方法
        3.3.1 任务池方法简介
        3.3.2 任务池方法的GPU实现
        3.3.3 自适应负载因子方法
    3.4 CUIRRE库
        3.4.1 负载均衡模块
        3.4.2 诊断模块
        3.4.3 特征化模块
        3.4.4 CUIRRE库的应用
    3.5 应用集
        3.5.1 测试应用
        3.5.2 真实应用
    3.6 实验方法
        3.6.1 硬软件配置
        3.6.2 其它负载均衡方法
        3.6.3 测试过程
        3.6.4 性能指标
        3.6.5 开销测量
    3.7 实验结果及分析
        3.7.1 应用的特征化
        3.7.2 负载均衡方法性能比较
        3.7.3 自适应负载因子方法的性能评估
    3.8 本章小结
第四章 高性能GPU应用GGraph
    4.1 研究背景及简介
    4.2 CPU和GPU异构系统上的图处理
        4.2.1 图算法
        4.2.2 图的表示
        4.2.3 计算模型
        4.2.4 磁盘的I/O特性
    4.3 GGraph平台的架构
        4.3.1 图数据的存储
        4.3.2 读写模块
        4.3.3 分图模块
        4.3.4 消息管理模块
        4.3.5 内存管理模块
    4.4 实验方法
        4.4.1 图算法
        4.4.2 软件和实验配置
        4.4.3 硬件平台
        4.4.4 测试图数据集
        4.4.5 性能指标
    4.5 实验结果及分析
        4.5.1 自适应负载均衡方法的评测
        4.5.2 可扩展性评测
        4.5.3 所有平台的性能比较
        4.5.4 运行不同算法的性能比较
        4.5.5 所有平台的能效比较
    4.6 本章小结
第五章 总结与展望
    5.1 本文工作总结
    5.2 后续研究方向
参考文献
致谢
攻读博士期间发表、录用和完成的学术论文目录



本文编号:3901621

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3901621.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户b1418***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com