一種基于自然共享最近鄰居搜索的發(fā)現(xiàn)簇和離群點(diǎn)的算法
本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,尤其是涉及一種基于自然共享最近鄰居搜索的發(fā)現(xiàn)簇和離群點(diǎn)的算法。其特征在于,首先對數(shù)據(jù)集進(jìn)行自然最近鄰居搜索,當(dāng)發(fā)現(xiàn)數(shù)據(jù)集中沒有共享最近鄰居的點(diǎn)的數(shù)量不再變化時(shí)搜索結(jié)束,得到搜索最近鄰個數(shù)n;根據(jù)提出的自然共享鄰居定義,計(jì)算每個對象在n近鄰下得到的自然共享最近鄰居關(guān)系;然后基于共享最近鄰的自然鄰居搜索算法確定了每個對象的自然共享最近鄰域關(guān)系,根據(jù)該自然共享最近鄰居關(guān)系,對數(shù)據(jù)進(jìn)行聚類和離群點(diǎn)判別。本發(fā)明的算法中提出一種新的共享最近鄰居關(guān)系和自然鄰居搜索終止條件,解決了現(xiàn)有算法因?yàn)樽匀秽従雨P(guān)系定義不夠嚴(yán)密及搜索條件不夠科學(xué)而引起的聚類效果不好和離群點(diǎn)檢測精度不高的問題。
中國農(nóng)業(yè)大學(xué)
2021-04-11