新書推薦:

《
中国社会各阶层分析
》
售價:NT$
449.0

《
纯粹·破壁与神游
》
售價:NT$
418.0

《
春秋大义:中国传统语境下的皇权与学术(新版)
》
售價:NT$
449.0

《
女人们的谈话(奥斯卡金像奖最佳影片提名、最佳改编剧本奖 原著!)
》
售價:NT$
286.0

《
忧郁的秩序:亚洲移民与边境管控的全球化(共域世界史)
》
售價:NT$
653.0

《
一周一堂经济学课:为了更好地理解这个世界
》
售價:NT$
500.0

《
慢性胃炎的中医研究 胃
》
售價:NT$
3050.0

《
南移:宋代社会中心的转迁
》
售價:NT$
755.0
|
編輯推薦: |
本书入选“清华大学优秀博士学位论文丛书”,语言逻辑性强,表述流畅,有很强的可读性。
|
內容簡介: |
高性能计算机的性能持续增长,然而由于负载不均、资源竞争等性能问题,大量并行程序无法高效地利用底层硬件系统,导致了极大的资源浪费。围绕上述挑战,本书在大规模并行程序性能分析与优化方面开展了深入研究,主要的特色为结合编译技术和图分析技术进行性能分析与优化指导。书中介绍了性能分析与优化的相关背景和当前面临的重要挑战,并针对这些挑战进行了四方面的研究工作:针对并行程序性能瓶颈定位难的挑战,提出了基于图分析技术的自动可扩展性瓶颈检测方法,并实现了轻量级的瓶颈检测系统;针对大规模并行程序性能分析系统开发复杂度高的挑战,提出了面向性能分析的领域特定编程框架;针对性能优化策略选择难的挑战,提出了异步策略感知的性能建模方法;基于上述性能分析与建模技术,设计并实现了面向领域的多层次自动性能优化系统。
本书可为具有一定计算机系统结构或高性能计算知识的本科生、研究生及研究人员,特别是研究方向为并行计算、性能分析与优化等相关领域的研究者提供一定的参考与帮助。
|
關於作者: |
金煜阳,清华大学计算机系高性能所博士后,助理研究员。2022年于清华大学计算机系高性能所获得博士学位。主要研究兴趣包括高性能计算、性能分析与优化、编译器等,相关研究成果发表于SC、PPoPP、TPDS等高性能计算领域国际顶级会议与期刊,曾获清华大学优秀博士学位论文奖、清华大学优秀博士毕业生等称号。
|
目錄:
|
第 1 章 引言 1
1.1 本书背景及意义 1
1.1.1 性能分析技术的现状 4
1.1.2 性能优化技术的现状 5
1.2 大规模并行程序性能分析与优化面临的关键问题 6
1.3 本书的主要研究内容与贡献 8
1.3.1 本书的主要贡献 8
1.3.2 本书的组织及各章内容简介 9
第 2 章 相关工作 11
2.1 性能分析相关研究 11
2.1.1 程序分析 11
2.1.2 性能分析技术 14
2.2 性能预测相关研究 18
2.2.1 性能建模 18
2.2.2 性能模拟 21
2.3 性能优化相关研究 22
2.3.1 并行程序优化 22
2.3.2 统一编程模型 23
2.3.3 自动优化框架 24
第 3 章 基于图的并行程序可扩展性瓶颈检测 26
3.1 整体框架 28
3.2 图的生成 29
3.2.1 静态分析 29
3.2.2 动态分析 34
3.2.3 程序性能图的生成 41
3.3 可扩展性瓶颈检测 42
3.3.1 性能问题顶点检测 42
3.3.2 反向追踪根因分析 44
3.4 实现与使用方法 46
3.5 实验结果 47
3.5.1 实验环境 47
3.5.2 程序结构图分析 48
3.5.3 开销分析 49
3.5.4 应用案例 51
3.6 小结 57
第 4 章 面向性能分析的领域特定编程框架 59
4.1 整体框架 62
4.1.1 PerFlow系统框架 62
4.1.2 编程示例:通信分析任务 64
4.2 程序性能抽象 64
4.2.1 程序抽象图的定义 65
4.2.2 静动态分析 66
4.2.3 程序抽象图的构建 66
4.2.4 程序抽象图的视图 69
4.3 性能分析过程抽象 71
4.3.1 性能分析数据流图 71
4.3.2 性能分析数据流图的元素 72
4.3.3 性能分析子任务 73
4.3.4 性能分析范例 76
4.3.5 框架的使用方法 78
4.4 实验结果 79
4.4.1 实验配置 79
4.4.2 开销分析 80
4.4.3 程序抽象图信息 81
4.4.4 应用案例 82
4.5 小结 93
第 5 章 异步策略感知的精确性能建模 95
5.1 整体框架 96
5.2 模块内建模 98
5.2.1 层次化建模技术 98
5.2.2 解析—统计结合的建模技术 99
5.3 模块间模拟 101
5.3.1 异步策略表达 101
5.3.2 硬件感知性能模拟 101
5.4 HPL 分析 103
5.4.1 HPL 介绍 103
5.4.2 HPL 各模块的模块内模型 105
5.5 实验与分析 107
5.5.1 实验配置 107
5.5.2 端到端预测精度测试 108
5.5.3 模块预测精度测试 110
5.5.4 假设分析 110
5.5.5 预测效率测试 112
5.6 小结 112
第 6 章 面向领域的多层次性能优化框架 114
6.1 框架设计 115
6.2 面向计算流体力学领域的中间表达和语言 117
6.2.1 领域中间表达 117
6.2.2 领域特定语言 121
6.3 多层次中间表达递降 125
6.3.1 领域中间表达递降 126
6.3.2 通用中间表达递降 126
6.4 多层次感知优化 128
6.4.1 领域级优化 128
6.4.2 通用优化 132
6.4.3 硬件级优化 132
6.5 实验. 134
6.5.1 实验配置 134
6.5.2 端到端性能 135
6.5.3 性能模型的有效性测试 135
6.6 小结 139
第 7 章 总结与展望 140
7.1 本书工作总结 140
7.2 后续研究方向 141
参考文献 143
致谢 156
|
內容試閱:
|
在快速发展的科技时代,高性能计算已成为推动科学进步和技术发展的关键技术之一。金煜阳博士的研究聚焦于并行程序性能分析与优化,是高性能计算领域的重要方向,旨在通过性能分析和优化技术提升大规模并行程序的计算效率。
随着高性能计算技术的不断进步,高性能计算机的规模与计算能力大幅提升。尽管如此,许多并行程序却未能充分发挥其计算潜力。这一矛盾的存在,提醒我们必须重视并行程序的性能优化问题。本书针对大规模复杂并行程序的分析与优化问题开展了深入研究,提出了一系列切实可行的解决思路。书中提出的研究工作创新地在并行程序性能分析与优化的过程中结合了编译技术与图分析技术,提出了针对大规模并行程序的轻量级性能采集、建模与分析工具。基于这些工具进一步实现的多层次性能优化系统,通过对应用程序和硬件平台特性的全面感知,实现了计算流体力学领域应用的自动优化。这些研究工作为高性能计算技术的发展提供了有益的参考。
本书的研究成果,不仅在理论层面丰富了并行计算研究的工具和方法论,也在气象预测、洋流模拟、地震预测、生物制药、材料研制、航天航空等各类科学研究领域涉及并行计算的实际应用方面具有宝贵的参考与借鉴意义。通过对并行计算技术的深入研究与应用,研究者们能够更有效地提高并行程序计算效率,解决复杂的领域科学问题,从而推动相关领域的技术进步与创新。
我由衷地祝贺金煜阳博士在这一研究方向上取得的丰硕成果,并深信本书将为广大学者、研究者及从业者提供重要的启发与参考,推动并行计算技术在各领域的进一步发展与应用。展望未来,我期待更多借鉴于金煜阳博士工作的技术与方法被提出,探索并发现更多并行计算的应用潜力,助力科学与技术的跨越式发展。
清华大学计算机科学与技术系长聘教授
|
|