并行程序性能監(jiān)測工具包
針對集群和多核服務器平臺,該軟件工具集可以對系統(tǒng)資源和并行程序性能進行在線監(jiān)測和性能分析展示,幫助用戶監(jiān)測系統(tǒng)資源和發(fā)現(xiàn)并行程序瓶頸,輔助進行程序優(yōu)化。性能數(shù)據(jù)的采集主要是通過對被監(jiān)測進程的插樁和包裝庫的結合實現(xiàn),可對MPI程序、OpenMP程序和CUDA程序進行性能監(jiān)測。 本項目主要特點如下。 1.合理的數(shù)據(jù)采集方式,可以對混合結構高性能計算系統(tǒng)進行性能監(jiān)測,較少的監(jiān)測擾動; 2.基于MRnet的樹形數(shù)據(jù)匯聚和類庫,保證了大量性能監(jiān)測數(shù)據(jù)的快速高效匯集,并提供同步,匯總等功能接口; 3.多種數(shù)據(jù)分析統(tǒng)計方法,高效的分析和多視角可視化圖形展示,輔助用戶分析瓶頸進行優(yōu)化。該成果在國家863計劃支持下,已在多個計算中心應用,獲得國家專利3項。
北京航空航天大學
2021-04-13