針對集群和多核服務(wù)器平臺(tái),該軟件工具集可以對系統(tǒng)資源和并行程序性能進(jìn)行在線監(jiān)測和性能分析展示,幫助用戶監(jiān)測系統(tǒng)資源和發(fā)現(xiàn)并行程序瓶頸,輔助進(jìn)行程序優(yōu)化。性能數(shù)據(jù)的采集主要是通過對被監(jiān)測進(jìn)程的插樁和包裝庫的結(jié)合實(shí)現(xiàn),可對MPI程序、OpenMP程序和CUDA程序進(jìn)行性能監(jiān)測。
本項(xiàng)目主要特點(diǎn)如下。
1.合理的數(shù)據(jù)采集方式,可以對混合結(jié)構(gòu)高性能計(jì)算系統(tǒng)進(jìn)行性能監(jiān)測,較少的監(jiān)測擾動(dòng);
2.基于MRnet的樹形數(shù)據(jù)匯聚和類庫,保證了大量性能監(jiān)測數(shù)據(jù)的快速高效匯集,并提供同步,匯總等功能接口;
3.多種數(shù)據(jù)分析統(tǒng)計(jì)方法,高效的分析和多視角可視化圖形展示,輔助用戶分析瓶頸進(jìn)行優(yōu)化。
該成果在國家863計(jì)劃支持下,已在多個(gè)計(jì)算中心應(yīng)用,獲得國家專利3項(xiàng)。
掃碼關(guān)注,查看更多科技成果