針對大規模分布式計算系統例如云計算系統、數據中心等的運維需求,研發了針對大規模計算系統的預測性監控技術。并開發了一個可擴展的監控系統。該系統的特點為:
1)基于語義事件表達監控信息,開發了復雜事件處理器,可以支持用戶定義針對復雜模式的事件探測組件,從而使系統能夠對自動探測復雜的狀態變化;
2)基于發布訂閱模式的事件傳輸網絡,使得監控系統可以規模擴展,因而適應了大規模計算系統的監控需求;
3)開發了多種性能預測算法和異常探測算法,實現了對計算機和應用性能的長期預測。
本項目的成果已經應用到多個企業的系統監控上。項目的成果也發表在INFOCOM、IFIP Networking,IEEE Transaction on Parallel and Distributed Systems, Journal of Systems and Software, Software: Practice and Experience等著名會議和期刊上。項目成果已經申請了10項專利。
掃碼關注,查看更多科技成果