DBSCAN与Kmeans相结合的手机大数据聚类方法研究
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Research on Mobile Big Data Clustering Method Based on DBSCAN and Kmeans
  • 作者:史新颖 ; 夏元平 ; 毛曦 ; 殷红梅
  • 英文作者:SHI Xinying;XIA Yuanping;MAO Xi;YIN Hongmei;Faculty of Geomatics,East China University of Technology;Chinese Academy of Surveying and Mapping;
  • 关键词:手机信令数据 ; 聚类 ; 点位误差
  • 英文关键词:cell phone signaling data;;clustering;;point error
  • 中文刊名:BJCH
  • 英文刊名:Beijing Surveying and Mapping
  • 机构:东华理工大学测绘工程学院;中国测绘科学研究院;
  • 出版日期:2019-02-20
  • 出版单位:北京测绘
  • 年:2019
  • 期:v.33
  • 基金:中国测绘学院研究院基本科研业务经费项目(7771802,7771721);; 江西省星火计划项目(20161BBB29002)
  • 语种:中文;
  • 页:BJCH201902002
  • 页数:6
  • CN:02
  • ISSN:11-3537/P
  • 分类号:10-15
摘要
时空大数据是目前研究的热点。如何从海量手机信令数据中获取有价值的信息是研究手机信令数据的难点。本文在基于距离的点聚合方法的基础上,提出了将基于密度聚类算法DBSCAN与基于距离聚类算法kmeans相结合的点聚合算法。采用DBSCAN与kmeans相结合的点聚合算法实现手机信令数据的可视化,不仅能避免手机信令数据在可视化时点数据的堆叠和覆盖问题,而且使得其聚合后获取数据的空间分布结构更准确。
        Spatio-temporal big data is a hot research topic nowadays.How to obtain valuable information from massive signaling data of mobile phone is a difficult problem in the research of mobile phone signaling data.Based on the distance-based point aggregation method,this paper proposes a point aggregation algorithm which combines the densitybased clustering algorithm DBSCAN with the distance-based clustering algorithm kmeans.The point aggregation algorithm based on DBSCAN and kmeans is used to realize the visualization of mobile signaling data.It not only avoids the problem of stacking and overlaying the point data in visualization,but also makes the spatial distribution structure of the data acquired after aggregation more accurate.
引文
[1]朱庆,付萧.多模态时空大数据可视分析方法综述[J].测绘学报,2017,46(10):1672-1677.
    [2]张惠.手机数据在交通规划中的应用研究[J].互联网天地,2015(5):60-64.
    [3]李祖芬.基于手机信令定位数据的居民出行时空分布特征提取方法[J].交通运输研究,2016,2(1):51-57.
    [4]张铁映,李宏伟,许栋浩,等.采用密度聚类算法的兴趣点数据可视化方法[J].测绘科学,2016,41(5):157-162.
    [5]张保钢.时空数据可视化表达研究[J].北京测绘,2006(3):7-9.
    [6]丁立国,熊伟,周斌.专题图空间点聚合可视化算法研究[J].地理空间信息,2017,15(5):6-9.
    [7]李新延,李德仁.DBSCAN空间聚类算法及其在城市规划中的应用[J].测绘科学,2005,30(3):51-53.
    [8]戴凤娇.基于百度地图的标记点聚合算法研究[J].中国科技信息,2013(23):82-85.
    [9]柏宇轩.Kmeans应用与特征选择[J].电子科技与软件工程,2018(1):186-187.
    [10]张登荣.Kernel-Kmeans:一种基于核密度估计的空间聚类算法[J].杭州师范大学学报,2017,16(3):324-329.
    [11]宗琴,姜树辉,秦万英.K均值聚类进行多个粗差定位[J].北京测绘,2018(1):37-39.
    [12]周红芳,王鹏.DBSCAN算法中参数自适应确认方法的研究[J].西安理工大学学报,2012(3):289-293.
    [13]诸葛越.百面机器学习:算法工程师带你去面试[M].北京:人民邮电出版社,2018.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700