近日,中国科学院软件研究所总体部研究团队在处理器缓存性能优化与结构设计方面取得进展。该研究提出一种基于合并相似访存模式的数据缓存预取方法,可有效提升处理器整体性能。
硬件数据预取是通过提前加载处理器核心所需数据到缓存,来降低处理器核心对内存的平均访问延迟,从而提升处理器整体性能。硬件数据预取方法研究是计算机体系结构领域长期的研究热点之一。
研究团队通过分析不同程序负载下的访存行为模式,发现具有相同触发地址偏移的访存模式之间存在较高的相似性。基于这一发现,研究提出了基于合并相似访存模式的硬件预取新方法——PMP。PMP是根据触发偏移和程序计数(PC)特征对访存模式进行聚类,然后通过量化统计方法进行相似模式合并,最后在预取阶段基于访问频率对预取目标进行提取。
在相同的实验环境下,PMP性能超过国际先进预取方法Bingo约2.9%,且所需存储开销仅为其1/30。这解决了当前先进硬件预取方法实现复杂、硬件存储开销大、在商业产品的应用上受到限制等问题。
相关研究成果以Merging Similar Patterns for Hardware Prefetching为题,被计算机体系结构领域顶级学术会议MICRO 2022录用。
基于合并相似访存模式的预取器设计概览
对比实验结果