本發明公開了一種云環境下的分布式系統多級故障容錯方法, 包括:基于虛擬機磁盤快照的分布式應用協同備份算法,能夠對 I/O 狀態以及所依賴的操作系統環境進行備份;分層故障檢測和恢復機制, 能夠實時地檢測物理層、虛擬化層、云平臺層、虛擬機 OS 層和應用 層故障,針對不同的故障采用相匹配的故障恢復方法。使得故障檢測 和恢復細化到模塊,采用自頂向下逐級恢復的策略,做到恢復開銷最 小化;基于模板的虛擬容錯集群服務部署策略,用