摘要
不确定空间数据聚类分析已经成为空间数据挖掘领域的一个研究热点.近年来,在传统划分与基于密度的聚类算法基础上,通过重新定义不确定对象间的几何距离或概率距离,一系列不确定空间数据聚类算法相继被提出,然而这些算法的有效性尚缺乏客观的评价.为此,本文选取当前具有代表性的6种算法进行实验对比分析.首先,设计40组包含预设模式的模拟数据进行测试.进而,采用亚洲气候数据集对6种方法识别气候区的能力进行比较分析,以Koppen-Geiger气候分类结果为基准对各种方法的实际应用效果进行评价.借助Jaccard系数对各种方法的聚类精度定量度量后,发现:(1)对于同类型聚类算法,采用概率距离的算法聚类精度总体优于采用几何距离的算法;(2)采用概率距离的划分算法聚类精度优于基于密度的算法,其中采用概率距离的K-medoids算法(K-Medoids-KL)的聚类精度最高.