摘要
大数据技术的发展为海量行业数据的分析、挖掘商业价值提供支撑。通过华为大数据平台分析海量车辆销售数据,步骤包括设计分析方案、源数据分析、数据预处理、HQL分析、使用Python编程分析等,得出可视化的分析结果,为使用大数据平台分析海量数据提供参考。
The development of big data technology provides support for the analysis of massive industry data and the mining of commercial value. Uses Huawei big data platform to analyze massive vehicle sales data. The steps include design analysis scheme, source data analysis, data preprocessing, HQL analysis, Python programming analysis and so on. Finally, the visual score is obtained. The results provide reference for the analysis of massive data using the big data platform.
引文
[1]景晗,郑建生,陈鲤文,许朝威.基于MapReduce和HBase的海量网络数据处理[J].科学技术与工程,2015(34).
[2]刘越,李锦涛,虎嵩林.基于代价估计的Hive多维索引分割策略选择算法[J].计算机研究与发展,2016(04).
[3](美)怀特(White). Hadoop权威指南[M].清华大学出版社,2011.
[4]刘勇,陆小慧.分布式文件系统的文件访问处理、安全访问方法及装置[J].广东通信技术,2018(03).
[5]林文辉.基于Hadoop的海量网络数据处理平台的关键技术研究[D].北京邮电大学,2014.
[6]王寅田.基于Hadoop的交通物流大数据处理系统设计与实现[D].上海交通大学,2014.
[7]郭涛.华为“4V”金字塔打通大数据价值通道[N].中国计算机报,2013(025).
[8]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012(06).