一種基于關聯分析與關聯分類的蛋白質二級結構預測技術
發明公開了一種基于關聯分析與關聯分類的蛋白質二級結構預測技術,以雙庫協同機制為基礎,將KDD*過程模型引入蛋白質二級結構預測問題中,KAAPRO方法以數據挖掘(知識發現)為主體,采用基于KDD*過程模型Maradbcm算法以及關聯規則分類D-CBA方法。KAAPRO方法所取得關聯規則在一定程度上揭示了氨基酸物化屬性對蛋白質二級結構的影響關系,從而提高了預測的精度。其中Maradbcm算法挖掘意外規則的特性對純度較高的α蛋白質庫與β蛋白質庫進行關聯規則的挖掘,由此獲得的挖掘結果是精化的規則。D-CBA關聯分類方法使用可信度與支持度的測度作為一個復合型度量來進行蛋白質關聯分類。在保證預測精度的同時,為生物學家對二級結構進一步分析提供了依據。
北京科技大學
2021-04-11