基于网格的密度峰值聚类算法研究

作者：滕建 ; 乐红兵
关键词：聚类 ; 网格 ; 密度 ; 密度峰值
中文刊名：XXXT
机构：江南大学物联网工程学院;
出版日期：2018-11-20
出版单位：信息系统工程
年：2018
期：No.299
语种：中文;
页：XXXT201811103
页数：3
CN：11
ISSN：12-1158/N
分类号：150-152

摘要

现有的密度峰值聚类算法存在时间复杂度过高和空间复杂度过高的问题,基于此,论文提出。通过网络划分的方法,将各个数据点映射到相应的网格来解决这个问题,并且在计算网格密度时为了解决网格划分对密度分布的割裂引入了邻域网格密度贡献的概念,克服了传统网格划分所产生的不平滑现象。此方法降低了聚类计算时的时间复杂度和空间复杂度,使得算法适用与大规模数据聚类。通过在数据集上进行实验显示该算法在保证准确性的前提下能有效减少时间和空间复杂度。

引文

[1]Jain A K,Murty M N,Flynn P J.Data Cluatering:A Review[J].ACMComputering Surverys,1999,31(3):264-323.
    [2]贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007(01):10-13.
    [3]Rodriguez A,Laio A.Clustering by fast serach and find of density peaks.Science,2014,344(6191);1492-1496.
    [4]赵慧,刘希玉,崔海青.网格聚类算法[J].计算机技术与发展,2010,20(09):83-85+89.
    [5]卜长莉.“差序格局”的理论诠释及现代内涵[J].社会学研究,2003(01):21-29.
    [6]杨洁,王国胤,庞紫玲.密度峰值聚类相关问题的研究[J].南京大学学报(自然科学),2017,53(04):791-801.
    [7]高永梅,黄亚楼.一种基于网格和密度的数据流聚类算法[J].计算机科学,2008(02):134-137.

地址：北京市海淀区学院路29号邮编：100083

电话：办公室：(+86 10)66554848；文献借阅、咨询服务、科技查新：66554700