深圳先进院在GPGPU极限功耗测试程序自动生成关键技术研究方面取得重要进展
近日,中国科学院深圳先进技术研究院数字所异构智能计算体系结构与系统研究中心在GPGPU极限功耗测试程序自动生成关键技术研究方面取得重要进展,相关成果以Guser: A GPGPU Power Stressmark Generator为题被计算机体系结构顶级会议IEEE HPCA(High Performance Computer Architecture)2024录用为长文。深圳先进院硕士生单亚龙在数字所喻之斌研究员的指导下完成了该研究。
该项研究致力于准确评估通用计算GPU(GPGPU)的极限功耗,提出了一种GPGPU极限功耗测试程序自动生成方法, 为GPGPU供电和散热系统的优化设计提供依据。“Power stressmark”对于估计GPGPU 热设计功耗 (TDP) 以确保高效的功耗控制至关重要。Guser是首个生成 GPGPU Power stressmark的系统方法。主要包括三个关键方法:首先,指令功耗分析,分析了每个算术指令在不同操作数数据宽度下的功耗行为、执行时间、流水线利用率和硬件单元占用情况;其次,基于流水线的指令分组,用于将所有 PTX 指令分类为多个组;最后,量化功耗影响因子的重要性,用于选择少量但重要的可调节参数。基于GPGPU Tesla T4(图灵架构)和 Tesla A10(安培架构)的实验表明,使用Guser为 T4 生成的 Power stressmark(T4-stresser)功耗达 109.3 瓦特,以及为 A10 生成的Power stressmark(A10-stresser)功耗达 238.7 瓦特,分别比当前最先进CPU Power stressmark方法高出 48.7% 和 73%。 此外,T4-stresser 和 A10-stresser 的功耗明显高于当前主流的三个基准测试程序集(Cactus、Rodinia 和 Parboil)中任何基准测试所达到的功耗。
IEEE HPCA (High Performance Computer Architecture)是由IEEE举办的计算机体系结构领域的顶级会议,与ASPLOS, ISCA, MICRO并称为计算机体系结构领域的“四大顶会”。 参会对象包括微体系结构、云计算、计算机系统等领域的研究人员或学生。
Guser框架
指令功耗分析
Guser与基准测试程序对比
Guser与最先进CPU Power stressmark方法对比