科研进展

深圳先进院在工作负载感知的NUMA服务器页表自动复制关键技术研究方面取得重要进展

时间:2023-11-16  来源:数字所 文本大小:【 |  | 】  【打印

  近日,中国科学院深圳先进技术研究院数字所异构智能计算体系结构与系统研究中心在工作负载感知的NUMA服务器页表自动复制关键技术研究方面取得重要进展,相关成果WASP: Workload-Aware Self-Replicating Page-Tables for NUMA Servers 被计算机体系结构顶级会议ASPLOS (Architectural Support for Programming Languages and Operating Systems,CCF-A类会议)2024录用为长文。博士生曲虹亮为第一作者,喻之斌研究员为第二和通讯作者。

  NUMA(Non-Uniform Memory Access,非统一内存访问)是一种服务器架构,是针对多处理器系统的一种内存组织方式。在这种架构中,应用程序被分配到不同的节点,每个节点拥有自己的本地内存。程序可以访问本地内存和其他节点的内存,但访问本地内存的速度要快于访问其他节点的远端内存。访问远端内存最终会导致程序性能下降,这称为NUMA效应。

  针对NUMA服务器上的大内存工作负载,页表自复制可以减少页表引起的NUMA效应。当前的页表自复制技术只能由用户手动启用。然而,页表自复制技术可能会提高,也可能会损害程序的性能,由用户去判断是否开启和何时开启是困难的。因此识别影响页表自复制效果的因素并实现其自动化开启/关闭至关重要。

  本研究是首个研究并实现页表自复制自动化的方法。我们对程序的特性和系统中程序混部对程序获得页表复制收益的影响进行分析,提出了两项创新技术。首先,我们确定了一组关键指标,这些指标在大多数处理器架构上都可获得,并可用于指示是否应启用/禁用页表复制。其次,基于这些指标我们设计了一种分层和渐进的机制,以自动启用/禁用特定程序的页表复制,从而提高该程序的性能。

  最后,我们在arm64和x86_64架构的服务器上都进行了验证。实验结果表明,本研究在多NUMA节点场景下可以将程序的性能提高1.82倍,在进程迁移情况下可以提高6.69倍。此外,它可以自动将数据中心应用程序的整体性能提高1.36倍。这表明本研究可以在云数据中心中得到实际应用。

  ASPLOS (Architectural Support for Programming Languages and Operating Systems)是由ACM举办的计算机体系结构领域的顶级会议,与HPCA, ISCA, MICRO并称为计算机体系结构领域的“四大顶会” 参会对象包括微体系结构、云计算、计算机系统等领域的研究人员或学生。 

 

 

WASP工作流程 

 

WASP 决策机制 

  

WASP与最先进页表复制程序Mitosis对比(多NUMA节点场景) 

  

WASP与最先进页表复制程序Mitosis对比(进程迁移场景)