支持向量机预测在我国城镇失业率研究中的实证分析
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
失业问题始终是当今世界各国社会经济发展的重大问题,它既是综合性的经济问题,又是复杂的社会问题。同时,失业是宏观经济中特别重要的三个指标之一,因此研究我国城镇失业率具有积极的现实意义
     论文中的数据来自于中华人民共和国统计局、国家统计数据库、国研网与和讯网,分别应用多元回归分析和支持向量回归法对我国城镇失业率进行预测,最后得出基于支持向量回归法优于多元回归分析方法。文章的主要内容是:本文绪论介绍了论文的背景和研究意义,对失业率与支持向量机进行了系统研究。第二章介绍了相关的预测方法,分别从定性预测和定量预测进行了研究。在定量预测中主要介绍了时间序列预测、多元回归预测、灰色预测、人工神经网络预测、支持向量回归和组合预测。第三章介绍了支持向量机的核心理论。其内容主要包括机器学习、统计学习理论和支持向量机三个方面。支持向量机方法是基于统计学习理论的一种算法,其基本理论就是VC维和结构风险最小化原理。第四章应用多元线性回归法、非线性回归法、神经网络法、线性核函数的支持向量机法、高斯径向基核函数的支持向量机法对我国城镇失业率进行了实证分析。这五种方法从曲线拟合图、拟合相对误差、拟合精度三个方面进行比较,得出支持向量机回归法是一种较理想的曲线拟合法。支持向量机回归法选取线性核函数和高斯径向基核函数对我国城镇失业率进行拟合,其拟合精度分别是0.177%和0.195%。最后,文章应用上述五种方法对2010年至2015年我国城镇失业率进行预测,并得出其预测结果。
Unemployment has always been a major social and economic development issue throughout the world. It is both a comprehensive economic problem, but also a complex social problem. Meanwhile, unemployment is one of three important indicators in microeconomic. Therefore, the study of urban unemployment rate has a positive and practical significance.
     Daters of the thesis which come from Bureau of Statistics People's Republic of China, National statistical Database, Development Research Centre of the State Council Information Networks and Hexun Networks predict China's urban unemployment rate using regression analysis and support vector regression methods.
     ChapterⅠintroduces the background and significance of the paper. It also does some research in unemployment rate and Support Vector Machines. ChapterⅡpresents the relevant forecasting methods, which are studied from the qualitative and quantitative prediction. The quantitative prediction contents Time Series prediction, Multiple Regression forecast, Grey Prediction, Artificial Neural Networks prediction, Support vector Regression and compound prediction. ChapterⅢdescribes the core of the support vector machines theory in three aspects, which shows from machine learning, statistical learning theory and support vector machines. Support vector machines method is based on an algorithm of statistical learning theory. The basic theory is VC dimension (Vapnik and Chervonenkis dimension) and structural risk minimization principle. ChapterⅣhas made an empirical analysis in China's urban unemployment in the way of multiple linear regression, nonlinear regression, neural networks, support vector machine of linear kernel and Gaussian radial basis function. These five methods compares from three aspects,including the curve fitting, relative error and the fitting precision..Therefore,we come to a conclusion that the SVM regression method is an ideal curve fitting. Support vector regression selects linear kernel function and Gaussian Radial Basis Function kernel for its fitting. The fitting accuracy is of 0.177% and 0.195%. Finally, this paper forecasts China's urban unemployment rate from 2010 to 2015 using those above five methods and obtained its results.
引文
[1]何计蓉.城镇失业预警系统的构建与决策支持研究[D].硕士学位论文.成都:成都理工大学,2008.
    [2]Vladimir N. Vapnik著.张学工译.统计学习理论的本质[M].北京:清华大学出版社,2000:55,91.
    [3]彭新俊.支持向量机若干问题及应用研究[D].博士学位论文.上海:上海大学,2008.
    [4]Cristianini N, and Schawe-Taylor J. An introduction to support vector machine. Cambridge:Cambridge University Press,2000.
    [5]Vapnik V N.The Natural of Statistical Learning Theory[M]. New York:Springer-Verlag,2000.
    [6]杨晶晶.中国城镇失业与非农经济增长的关系研究[D].硕十学位论文.广州:暨南大学,2008.
    [7]王磊.我国经济增长与失业的非线性关系研究[D].硕士学位论文.长春:吉林大学,2006.
    [8]杨姣.我国经济增长与失业率的关系研究[D].硕士学位论文.广州:暨南大学,2008.
    [9]杨帅国.胡晓华.朱冬和.2010.我国城镇登记失业率的数学模型与预测[J].海南师范大学学报(自然科学版).23(4):372-374
    [10]杨同豪.徐光亮.石林.2010.城镇登记失业率影响因素的探讨[J].数学的实践与认识.40(15):38-46.
    [11]张仁发.曾惠芳.叶佑林.索秀花.2010.基于ARIMA-BP模型的我国城镇登记失业率分析与预测[J].统计与决策.23:78-80.
    [12]宋芳.2009.基于GA-SVM模型的福建省城镇登记失业率预测[J].科技和产业.9(9):82-85.
    [13]姜仁锋,卢兵.实用预测技术[M].哈尔滨:哈尔滨船舶工程学院出版社,1993年:1-29.
    [14]王定成.支持向量机建模预测与控制[M].北京:气象出版社,2009.
    [15]Novikoff A B J.1962. On convergence proofs on perceptrons. Proceedings of the Symposium on the Mathematical Theory of Automata, Polytechnic Institute of Brooklyn,Ⅶ:615-622.
    [16]Solomoff R J.1960.A Preliminary Report on General Theory of Inductive inference[R]. Technical Report ZTB-138,Zator Company,Cambridge,MA.
    [17]Kolmogorov A N.1965.Three approaches to the quantitative definitions of information. Problem of Inform. Transmission,1(1):1-7.
    [18]Chaitin G J.1966. On the length of programs for computing finite binary sequences. J.Assoc. Comput. Math.,4:1559-1562.
    [19]Tikhnov A N.1963. On solving ill-posed problem and method of regularization. Doklady Akademii Nauk USSR,153:501-504
    [20]Ivannov V V.1962.On limear problems which are not well-posed. Soviet Math. Docl. 3(4):981-983
    [21]Phillips D Z.1962. A technique for numerical solution of certain integral equation of the first kind.J. Assoc,Comput.Math.,9:84-96.
    [22]Vapnik V N. and Chervonenkis A Ja.1968. On the uniform convergence of relative frequencies of events to their probabilities.Doklady Akademii Nauk USSR,181(4)(英译本:Sov. Math.Dokl.).
    [23]Vapnik V N. Estimation of Dependences Based on Empirical Data [in Russian]. Nauka, 1979.(English translation Springer Verlag,1982)
    [24]Lecun Y.1986.Learnig processes in an asymmetric threshold netword,Disordered systems and biological organizations,Les Houches,France,Springer,233-240.
    [25]Rumelhart D E, Hinton G E and Williams R J.1986. Learning internal representations by error propagation. Parallel distributed processing:Explorations in macrostructure of cognition, Vol.Ⅰ.,Badford Books,Cambridge,MA.,318-362.
    [26]Vapnik V N,Golowich S, Smola A.1997.Support Vector Method for Function Approximation,Regression Estimation, and Signal Processing[M].In M. Mozer,M. Jordan,T.Petsche,editor,Advances in Neural Information Processing Systems 9.Cambridge,MA,MIT Press:281-287.
    [27]Vapnik V N. Statistical Learning Theory [M].New York:Wiley,Inter~science Publication,1998.
    [28]边肇祺等.1988.模式识别[M].北京:清华大学出版社.
    [29]张学工.2000.关于统计学习理论与支持向量机[J].自动化学报,26(1):32-42.
    [30]陶卿,姚穗,范劲松,方廷健.2000.一种新的机器学习算法:Support Vector Machine..模式识别与人工智能[J].13(3):285-290.
    [31]叶晨洲,杨杰,姚莉秀,陈念贻.2002.统计学习理论的原理与应用.计算机与应用化学[J].19(6):712-716.
    [32]王华忠,俞金寿.2006.核函数方法及其模型选择.江南大学学报(自然科学版)[J].5(4):500-504.
    [33]赵海霞,吴胜昔,刘兴刚2004.统计学习和支持向量机的理论与应用.机械设计[J].21:105-108.
    [34]陶卿,曹进德,孙德敏.2002.基于支持向量机分类的回归方法.软件学报[J].13(5): 1024-1028.
    [35]白云超.可能性空间上统计学习理论的关键定理[D].硕十学位论文.保定:河北大学,2004.
    [36]唐文广.基于模糊样本的统计学习理论关键定理[D].硕十学位论文.保定:河北大学,2004.
    [37]刘杨.基于粗糙样本的统计学习理论的基础[D].硕士学位论文.保定:河北大学,2006.
    [38]李喜.SUGENO测度空间上统计学习理论的关键定理[D].硕士学位论文.保定:河北大学,2006.
    [39]张莉.支撑矢量机与核方法研究[D].博士学位论文.西安:西安电子科技大学,2002.
    [40]尹传环.结构化数据核函数的研究[D].博士学位论文.北京:北京交通大学,2007.
    [41]熊正超.径向基函数逼近中的若干问题研究[D].博士学位论文.上海:复旦大学,2007.
    [42]罗林开.支持向量机的核选择[D].博士学位论文.厦门:厦门大学,2007.
    [43]王朝勇.支持向量机若干算法研究及应用[D].博士学位论文.长春:吉林大学,2008.
    [44]Zhang X.1999. Using Class-center Vectors to Build Support Vector Machines[C].In Proceedings of NNSP'99.
    [45]Scholkopf B, Bartlett P,Smola A,Williamson R.1998. Support Vector Regression with Automatic Accuracy Control[C].In L.Niklasson,M.Bod'en,T.Ziemke,editors,Proceedings of ICANN'98,Perspectives in Neural Computing,Berlin,Springer Verlag:111-116.
    [46]Joachims T.1999.Making Large-scale SVM Learning Practical.In Scholkopf B.Burges C.J.C.,Smola A.J.,editors,Advances in Kernel Methods-Support Vector Learning.Cambridge,MA,MIT Press:169-184.
    [47]HsuC-W,Lin C-J.1999.A Simple Decomposition Method for Support Vector Machines[R].Technical Report, National Taiwan University.
    [48]刘勇.一种新的支持向量回归预测模型[D].硕士学位论文.武汉:华中科技大学2007.
    [49]范劲松,陶卿,方廷健.2001.基于统计学习理论优化感知器的遗传算法模式识别与人工智能.[J].14(2):211-215.
    [50]唐发明.基于统计学习理论的支持向量机算法研究[D].博十学位论文.武汉:华中科技大学,2005.
    [51]张国云.支持向量机算法及其应用研究[D].博士学位论文.长沙:湖南大学,2006.
    [52]秦玉平.基于支持向量机的文本分类算法研究[D].博士学位论文.大连:大连理工大学,2008.
    [53]梁绵绵.支持向量机和支持向量域描述的若干问题研究[D].博士学位论文.西安:西安电子科大学,2009.
    [54]王磊.支持向量机学习算法的若干问题研究[D].博十学位论文.成都:电子科技大学,2007.
    [55]薛贞霞.支持向量机及半监督学习中若干问题的研究[D].博士学位论文.西安:西安电子科大学,2009.
    [56]刘琴,黄襄念.2010.一种改进的自适应GA-SVM参数选择研究.电子科技[J].23(5):99-101.
    [57]汪廷华.支持向量机模型选择研究[D].博士学位论文.北京:北京交通大学,2009.
    [58]郭新辰.最小二乘支持向量机算法及应用研究[D].博士学位论文.长春:吉林大学2008.
    [59]杜喆.儿类支持向量机变型算法的研究[D].博十学位论文.西安:西安电子科技大学,2009:23-24.
    [60]Muller K R,Smola A J,et al.1997.Predicting Time Series with Support Vector Machines[C].In Gerstner W,Germond A etc.editors,Artificial Neural Networks-ICANN'97,Springer:999-1004.
    [61]Smola A J.1998. Learning with Kernels[D].PhD Thesis,Technische Universitat Berlin.
    [62]闻芳,卢欣,孙之荣,李衍达.1999.基于支持向量机(SVM)的剪接位点识别[J].生物物理学报,15(4):733-739.
    [63]卢增祥,李衍达.交互支持向量机学习算法及其应用[J].清华大学学报(自然科学版).1999;39(7):93-97.
    [64]刘广利,杨志民.一种新的支持向量回归预测模型[J].吉首大学学报(自然科学版),2002;23(3):28-31.
    [65]陶小龙.基于支持向量机的股市预测[D].硕十学位论文.北京:北京工业大学,2005.
    [66]徐凯.基于支持向量机的股指时间序列预测[D].硕士学位论文.成都:西南交通大学,2008.
    [67]向小东,宋芳.基于核主成分与加权支持向量机的福建省城镇登记失业率预测[J].系统工程与实践,2009:29(1):73-80.
    [68]赵辉,成立芹.企业人力资源结构的GA-SVM预测.统计与决策[J].2002;302(2):170-171.
    [69]李红星.基于统计学习理论的正则化最小二乘回归在时间序列建模和预测中的应用[D].博士学位论文.合肥:中国科技大学,2007.
    [70]张楠.基于支持向量机的金融时间序列预测[D].硕士学位论文.大连:辽宁师范大学,2009.
    [71]古红英.基于统计学习理论的虹膜识别研究[D].博士学位论文.杭州:浙江大学,2004.
    [72]吴飞跃.基于统计学习理论的故障分析与可靠度预测技术研究[D].硕士学位论文.武汉:华中科技大学,2007.
    [73]蒋金山.图像模式分类与检索:核函数方法与特征提取方法研究[D].博士学位论文.广州:华南理工大学,2004.
    [74]刘广利.基于支持向量机的经济预警方法研究[D].博士学位论文.北京:中国农业大学,2003.
    [75]王巍.基于统计学习理论的项目风险评价与预测研究[D].博士学位论文.天津:天津大学,2008.
    [76]周雄鹏编著.统计预测和决策[M].第一版,上海:立信会计图书用品社,1989:7-13.
    [77]唐万梅.几个预测方法及模型的研究[D].博士学位论文.呼和浩特:内蒙古大学,2006.
    [78]George E. P. Box. Gwilym M. Jenkins著.时间序列分析预测与控制[M](第三版).顾岚译.北京:中国统计出版社,1997:1.
    [79]刘大同.基于Online SVR的在线时间序列预测方法及其应用研究[D].博士学位论文.哈尔滨:哈尔滨工业大学,2010:3
    [80]张冬青.非线性非高斯时间序列预测研究.[D]博士学位论文.南京航空航天大学.2008:4
    [81]何晓群.实用回归分析[M].北京:高等教育出版社,2008:22,26-34.
    [82]邓聚龙.灰色系统基本方法[M].(第二版).武汉:华中科技大学出版社.2005:2.
    [83]牛铭奎.干式DCT离合器温度模型及其灰色预测控制研究[M].博士学位论文.长春:吉林大学.2008年.
    [84]刘金枝.堆浸浸出过程数值模拟分析及灰色预测研究[D].博士学位论文.长沙:中南大学.2007.
    [85]常城.国家级高新技术开发区经济发展灰色预测模型研究[D].博士学位论文.哈尔滨:哈尔滨工程大学.2005.
    [86]姜波.灰色系统与神经网络分析方法及其应用研究[M].博士学位论文.武汉:华中科技大学.2004.
    [87]徐耀群.混沌神经网络研究及应用[M].博士学位论文.哈尔滨:哈尔滨工程大学.2002.
    [88]侯木舟.基于构造型前馈神经网络的函数逼近与应用[M].博士学位论文.长沙:中南大学.2009.
    [89]陈诗一.非参数支持向量回归和分类理论及其在金融市场预测中的应用[M].北京: 北京大学出版社.2008.
    [90]刘启浩.风险值组合预测的理论与实证[D].博十学位论文.北京:北京工业大学.2008.
    [91]孙喜梅.城市路网实时动态交通信息的组合预测模型和方法研究[D].博士学位论文.长春:吉林大学.2002.
    [92]R.T.Clemen.Combining Forecast:A Review and Annotated Bibliography.International Journal of Forecasting.1989,1:151-163.
    [93]F.X.Diebold,P.Pauly.Structural change and the Combination of Forecasts.Journal of Forecasting.1990,6:21-40.
    [94]Y.Yang.Combining Forecasts Procedures:Some Theoretical Results.Econo-metric Theory.2004,20:176-190.
    [95]N.Cristianini,J.S.Taylor李国正.王猛.曾华军译.支持向量导论[M].电子工业出版社,2004.
    [96]Vapnik V N.许建华.张学工译.统计学习理论[M]北京:电子工业出版社,2004.
    [97]邓乃扬.田英杰.数据挖掘中的新方法—支持向量机[M].北京:科学出版社.2004:51,53,55,59,64-71,76,77,79-94,100,117-120.
    [98]中国国家统计局编.中国统计年鉴-2009[M].北京:中国统计出版社,2009.
    [99]和讯网.1978至2009年我国宏观经济数据[EB/OL].(2011-03-20)[2011-03-20]. http://mac.hexun.com/Default.shtml?id=A.
    [100]国研数据.1978至2009年我国宏观经济数据[EB/OL].(2011-03-20)[2011-03-20]. http://data.drcnet.com.cn/web/OLAPQuery.aspx?databasename=macro&cubeName=ne w_year_country&channel=1&nodeId=29
    [101]郑海燕.对我国失业问题影响因素的研究[J].经济与管理,2003,(10):12-13.
    [102]王亮.我国失业率统计指标变化对测度失业的影响分析[J].内蒙古民族大学学报(社会科学版),2007,33(3):94-96.
    [103]张兴会.杜升之.陈增强.袁著祉.莫荣.基于对角Elman神经网络的失业预测模型[J].南开大学学报(自然科学版),2002;35(2):60-64.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700