当前位置:主页 > 科技论文 > 计算机论文 >

并行计算可扩展性分析与优化——能耗、可靠性与计算性能

发布时间:2024-03-01 01:25
  并行计算是提高计算机系统性能的主要手段,然而随着系统规模的扩大,系统结构日益复杂,编程、存储、能耗和可靠性等问题大量涌现,它们均在不同程度上制约了并行计算的可扩展性。可扩展性的概念得到了进一步的发展,其内涵从单一的以提高计算性能为目标逐渐演变为权衡多种要素关系的综合性问题。因此,需对其重新审视和研究。 本文主要研究能耗与并行计算可扩展性以及可靠性与并行计算可扩展性的关系,即能耗可扩展性和可靠可扩展性问题,为此文中分能耗篇和可靠性篇分别针 对这两种可扩展性问题进行研究。在能耗篇中,主要工作体现在: 1.提出了能耗可扩展性模型(第二章) 度量模型是研究可扩展性问题的基础。文中基于加速比模型,考虑能耗与计算性能之间的关系,分别针对能量消耗有效性及能耗增长与性能增长之间的匹配程度建立度量模型,即能效加速比和能耗性能率模型。前者是能耗可扩展性的有效度量,后者关注能耗与性能的增长关系,将并行计算系统分类为红色可扩展系统、黄色可扩展系统和绿色可扩展系统。 2.提出了能耗墙理论(第三章) 当前,国际上对于“能耗墙”还未有一个统一的认识,尤其是其内涵及量化等均未有研究。本文提出的能耗墙是并行计算能耗可扩...

【文章页数】:158 页

【学位级别】:博士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 可扩展性
        1.1.1 传统可扩展性定义
        1.1.2 并行计算的发展历程
        1.1.3 面向高效能计算的可扩展性
    1.2 相关工作
        1.2.1 高性能计算度量指标
        1.2.2 高效能计算度量指标
    1.3 本文的研究内容
        1.3.1 能耗可扩展性
        1.3.2 可靠可扩展性
    1.4 本文的主要贡献与创新
    1.5 论文结构
第二章 能耗可扩展性模型
    2.1 面向能效的加速比模型
        2.1.1 系统能耗组成
        2.1.2 能效加速比
        2.1.3 能耗性能率
    2.2 基于能耗可扩展性的系统分类
    2.3 实验
        2.3.1 实验步骤
        2.3.2 实验结果
    2.4 相关工作
    2.5 小结
第三章 能耗墙
    3.1 能耗墙理论
    3.2 系统分类与能耗墙
    3.3 模拟实验
    3.4 案例分析
        3.4.1 3D-Torus
        3.4.2 胖树
    3.5 相关工作
    3.6 小结
第四章 面向能耗可扩展的能耗优化技术
    4.1 能耗优化模型
        4.1.1 通信流能耗
        4.1.2 动态能耗优化模型
    4.2 能耗优化模型分析
        4.2.1 动态能耗累加性
        4.2.2 动态能耗等价优化模型
    4.3 模型实现
        4.3.1 实现框架
        4.3.2 模拟退火算法
        4.3.3 任务布局在MPI 实现中的软件层次
    4.4 实验
        4.4.1 实验步骤
        4.4.2 实验结果
    4.5 相关工作
    4.6 小结
第五章 可靠可扩展性模型
    5.1 可靠加速比模型
        5.1.1 容错开销
        5.1.2 可靠加速比
    5.2 系统分类
    5.3 广义可靠加速比模型
    5.4 实验
        5.4.1 实验步骤
        5.4.2 实验结果
    5.5 相关工作
    5.6 小结
第六章 可靠墙
    6.1 可靠墙理论
    6.2 系统分类与可靠墙
    6.3 广义可靠墙理论
    6.4 模拟实验
    6.5 案例分析
        6.5.1 可靠加速比与可靠墙
        6.5.2 广义可靠加速比与广义可靠墙
        6.5.3 优化C&R 间隔分析
    6.6 相关工作
    6.7 小结
第七章 面向可靠可扩展的容错机制
    7.1 TMR 的可扩展性分析
        7.1.1 TMR 可扩展性分类
        7.1.2 传统TMR 可扩展性分析
        7.1.3 TMR 可扩展制约因素分析
    7.2 STMR 设计
        7.2.1 数据比较的通信局部化
        7.2.2 数据比较点及数据选择
        7.2.3 容错处理技术
    7.3 STMR 容错机制分析
    7.4 STMR 实现
        7.4.1 冗余进程簇结点划分实现
        7.4.2 数据比较的MPI 实现
        7.4.3 标记处理实现
    7.5 模拟实验
        7.5.1 实验目的和方法
        7.5.2 实验结果
    7.6 相关工作
    7.7 小结
第八章 结束语
    8.1 工作总结
    8.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果



本文编号:3915227

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3915227.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户62918***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com