网络大数据在固定资产投资价格指数编制中的运用研究
详细信息    查看官网全文
摘要
固定资产投资价格指数是我国价格指数体系的重要组成部分,是反映全社会、国民经济各门类及各类工程固定资产投资中涉及的各类投资品和收费项目价格的变动趋势和变动幅度重要统计指标,在反映固定资产投资需求和国民经济核算方面发挥重要作用。现行固定资产投资价格统计制度存在一些局限性,难以适应我国经济社会日新月异的发展需求;同时,大数据时代的来临,大数据技术的运用对政府统计带来了较大的挑战和机遇,固定资产投资价格统计制度改革势在必行。根据国家统计局统计改革规划安排,2017年将实施固定资产投资价格统计调查制度改革。本文参照现行的固定资产投资价格指数的方法制度,将网络大数据和现有的调查数据相结合,用Python和MySQL进行网络数据的爬取与存储,获取材料费、机械使用费和人工费用数据。用DBSCAN(密度聚类)方法从样本本身特征出发识别异常值,避免网络采集数据分类不严格、差异性较大的问题,形成同质可比的价格数据来计算规格品指数。用随机森林文本分类方法把采集的数据按照需要的类别进行归类,再用随机森林算法训练出分类模型,从而把采集数据纳入规格品目录进行指数计算。最后构建固定资产投资价格指数计算模型,采用Lowe指数和Young指数计算出材料费、机械使用费和人工费用的价格指数,并与国家统计局公布的数据进行比较,从而确保数据采集、处理和指数计算的合理性和科学性。
引文
[1]马建堂等.大数据在政府统计中的探索和应用[M].北京:中国统计出版社,2013.飞机
    [2]许小乐,“大数据”与政府统计改革[J].调研世界,2013(5):42-45.
    [3]郑京平.国家统计局:大数据给政府统计带来机遇[J].世界电信,2014(1-2):98-100.
    [4]舍恩伯格,库克耶著,盛杨燕,周涛译.大数据时代--生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.
    [5]李远芳,杜玮浩,李丽娜等.网络零售价格指数(i SPI)报告[R].杭州:阿里研究中心,2011.
    [6]吴晓蓉.K-均值聚类算法初始中心选取相关问题的研究[D].长沙:湖南大学计算机与通信学院,2008.
    [7]钟锐,夏政然,杨相磊.基于网络大数据的PPI计算及动态预警模型研究[J].全国统计建模大赛(第四届)获奖论文选.中国统计出版社.2015.
    [8]孙亦冰,赵子东,刘洪波.一种基于网络爬虫技术的价格指数计算模型[J].全国统计建模大赛(第四届)获奖论文选.中国统计出版社.2015.
    [9]李伟,董倩,孙娜娜.基于网络搜索数据的房地产价格预测[J].全国统计建模大赛(第四届)获奖论文选.中国统计出版社.2015.
    [10]曹丹.我国固定资产投资价格调查制度改革研究[J].国家统计局内网.2015:10-13
    [11]刘建伟,王晓红.固定资产投资价格调查制度改革的思路和目标[J].中国统计,2002(12).
    [12]赵林广.固定资产投资价格统计的难点与对策[J].数据,2007(11).
    [13]中国国家统计局.固定资产投资价格统计报表制度.2010
    [14]高琰,谷士文,蔡自兴等.机器学习中谱聚类方法的研究[J].计算机科学,2007,34(2):201-203.
    [15]韩春蕾,高婉君.我国月度CPI的组合预测及分析[J].统计与决策,2014(1):11-13.
    [16]A.Sylvester Young,Horst Koehler,Enrico Giovanini等.消费者价格指数手册:理论与实践.[M]北京:中国财政经济出版社,2008.10
    [17]刘艳丽.随机森林综述[J].南开大学硕士学位论文.2008
    [18]张华伟,王明文,甘丽新.基于随机森林的文本分类模型研究[J].山东大学学报(理学版).2015
    [19]任全,殷进,余奕佳.基于三经普信息化数据的湖南电子商务探索研究[J].全国统计建模大赛(第四届)获奖论文选.中国统计出版社.2015.
    [20]施开分,崔益康,宋勇军.利用照片数据的冬小麦面积遥感测量方法研究--基于固定视角拍摄照片的地物重投影坐标模型[J].全国统计建模大赛(第四届)获奖论文选.中国统计出版社.2015.
NGLC 2004-2010.National Geological Library of China All Rights Reserved.
Add:29 Xueyuan Rd,Haidian District,Beijing,PRC. Mail Add: 8324 mailbox 100083
For exchange or info please contact us via email.