用户名: 密码: 验证码:
回归模型中异方差数据的处理
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
经典线性回归模型的一个重要假设就是回归方程的随机扰动项u_i,具有相同的方差,也称同方差性。但在大多数经济现象中,这种假设不一定成立,有时扰动项u_i的方差随观察值的不同而变化,这就是异方差性。扰动项具有异方差性的模型称为异方差模型。如果对异方差模型进行OLS估计,就会产生严重的后果:参数估计量的方差不具有最小方差性;估计与预测的精度降低。因此,研究异方差的检验方法及存在异方差时的处理方法具有重要意义。
     本文在第一节中,提出了异方差问题,并且叙述了直接用普通最小二乘法处理异方差模型可能带来的严重后果。
     在第二节中,首先综述了各种文献中给出的常用的检验异方差的方法,它们有图示法、斯皮尔曼(Spearman)的秩相关系数检验法、帕克(Park)检验法、格莱舍尔(Glejser)检验法、戈德菲尔德-匡特(Goldfeld-Quandt)检验法。由于戈德菲尔德-匡特检验方法只适用于一个自变量,因此,本文对G-Q检验进行了推广,说明在多变量的情况下,可以利用主成分对样本数据进行排序,并强调使用戈德菲尔德-匡特检验的前提:低样本组各观察值的扰动项必须具有同方差性;高样本组各观察值的扰动项也必须具有同方差性,否则,检验的结果可能是错误的。对于这些方法,如何根据实际情况选择最好的检验方法是值得研究的。本文选用三种不同的异方差形式,对帕克检验、格莱舍尔检验、戈德菲尔德-匡特检验作随机模拟,并对这几种方法略作比较。
     异方差的存在虽然并不破坏普通最小二乘估计量的无偏性,但是估计量的方差变大了。由于估计量方差的变大,就使通常假设检验的值不可靠。因此,如果怀疑存在异方差或者已经检测到了异方差的存在,就要想办法克服它,使估计量具有较小的方差,使回归模型有较强的实用性。本文在第三节中,主要讨论异方差的处理方法。在异方差形式已知的情况下,用加权最小二乘法得到最优线性无偏估计。在异方差形式未知的情况下,可以根据残差图对异方差的形式作出一些合理的假定,然后对原模型作适当的变换,使得变换后的模型其扰动项的方差趋于稳定;或是找出合适的λ值,利用Box-Cox变换,使模型的扰动项具有同方差性,从而可使用普通最小二乘法求得变换后模型的参数估计,进而得出原模型的参数估计。
     对异方差不同的处理方法,可能得出不同的模型。这些模型虽然都能消除异方差,但需要进一步研究哪种模型比较适合,哪个模型更有效。本文在第四节中,结合一个具体实例。先用几种方法对数据是否具有异方差性进行检验,然后选择适当的方法进行变换,最后指出,可以通过对新模型作最小二乘拟合等方法,观察变换后的模型其数据的拟合程度,以确定模型的优劣。
     最后一节,对本文作一简单小结,并说明有一些问题有待进一步的研究。
One of the important hypotheses of classical linear regression model is that the random disturbances have equal variance. However in most economic phenomena, this kind of hypothesis is not necessary true. Sometimes the disturbances vary with the observations. This is called heteroscedasticity. The model which has such kind of property is referred to as heteroscedastic regression model. If it is estimated by the method of OLS, it will bring about serious effect: the variances of the parameter estimators are not the least, and the accuracy of estimation and prediction decreases. Thus, it is of great significance to study the hypothesis testing of heteroscedasticity and statistical inference for the regression models with heteroscedasticity.
    In the first part of this article, the problem of heteroscedasticity is put forward. The serious effect is also stated.
    In the first section of the second part, several commonly cited testing methods are introduced, such as graph method, Spearman rank correlation coefficients test, Park test, Glejser test and Goldfeld-Quandt test. As Goldfeld-Quandt test can only be applied to one independent variable, it is generalized in the second section. It shows that, in Multivariate situation, the data can be arranged according to their principle components. But there should be a premise: the disturbances of the lower data group should have equal variance and those of the higher data group have the same variance. Otherwise the test result may be incorrect. It is worth researching how to choose the best testing method according to specific situation. In the third section three different forms of heteroscedasticity are used in the random simulation and then Park test, Glejser test and Goldfeld-Quandt test are compared
    Although the existence of heteroscedasticity does not destroy the unbiasedness of the OLS estimators, the variances become larger. Thus, it makes the hypothesis testing unreliable. So, if heteroscedasticity is found exist through hypothesis testing, it should be dealt with in a suitable way. In the third part, the article mainly gives the methods to deal with the heteroscedasticity in different conditions.
    Using different methods to cope with heteroscedasticity may result in different models. Although these models can eliminate the heteroscedasticity, it is still necessary to make a further study to decide which model is much better and more effective. In the fourth part of this article, one real example is given. Firstly, several methods are used to test if there is heteroscedasticity in the data. Then some variance stabilizing transformation methods are applied to the data. Finally, it is pointed out that the least squares fitting may be used to the transformed data. Then goodness of fit is used to decide which model is better.
    The last part makes a brief conclusion of the article and points out that there are still some problems worth being further studied.
引文
[1] 《经济计量学原理与方法》刘余善 唐五湘 北京理工大学出版社 1989年
    [2] 《计量经济学》张寿 于清文 上海交通大学出版社 1984年
    [3] 横断面样本建模中的异方差问题和巴特列特检验 吴忠民 《数量经济技术经济研究》1988年 第二期
    [4] 《实用回归分析方法》 周纪芗 上海科学技术出版社 1990年
    [5] 《经济学中的统计方法》王学仁 科学出版社 2000年
    [6] 《计量经济学教程》 姜诗章 王锦功等 吉林大学出版社 1989年
    [7] 《经济计量分析》 威廉 H.格林著 王明舰 王永宏译 中国社会科学出版社 1998年
    [8] R.E.Park: Estimation With Heteroscedastic Error Terms, 《Econometrica》, Vol.34, No.4, 1966
    [9] George G.Judge, R.Carter Hill, William E.Griffiths, Helmut Lutkepohl Tsoung-Chao Lee: 《Introdution to The Theory and Practice of Econometrics》, John Wiley & Sons, Inc., 1982
    [10] 无截距项的经济计量模型的最小二乘法估计 袁建文 《数量经济技术经济研究》 1988年 第二期
    [11] 《回归分析》 周纪芗 华东师范大学出版社 1993年
    [12] 《SAS应用技巧》 胡良平等 中国科学技术出版社 1991年
    [13] 《METLAB6.0与科学计算》 王沫然 电子工业出版社 2001年
    [14] 《FOXPRO简明教程》 周晓玉等 电子工业出版社 2000年
    [15] 回归模型中异方差问题的克服 鄢君 《武陵学刊》(自然科学) 1999年5月 第20卷第3期
    [16] 回归模型中的异方差性的检验与分析 胡跃清 《东南大学学报》 1995年11月 第25卷第6期
    [17] 非线性回归模型相关性和异方差的检验 韦博成 胡跃清 《工程数学学报》 1994年11月
    [18] 异方差性的方差分析及其应用 张荣基 《数理统计与管理》 1999年7月 第18卷第4期
    [19] 《中国宏观经济计量模型》 毕吉耀 北京大学出版社 1994年
    [20] 《简明经济统计与计量经济》 林少宫 李楚霖 上海人民出版社 1993年
    [21] 《经济计量学与基础知识》 张守一 中国社会科学出版社 1984年
    [22] 《经济计量学教科书》 劳伦斯.克莱因著 谢嘉译 商务印书局 1983年
    [23] 《多元统计分析》周光亚 地质出版社 1982年
    [24] 《多元统计分析引论》 张尧庭、方开泰 科学出版社,北京1982年
    [25] 《实用多元统计分析》方开泰 华东师范大学出版社 1989年
    [26] 《计量经济学》于俊年 对外贸易大学出版社 2001年
    [27] Glejser H.A New Test for Heteroscedasticity J.Am Statist Ass. 1959 1(64)

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700