基于非参数统计的判别分析
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
概率密度函数是统计学中重要的概念之一,密度函数的非参数估计法是现代统计学发展的一个重要方向,它是基于已观察到的数据,利用无参数估计的方法对未知的概率密度函数进行估计,使得估计所得的概率密度函数与真实的概率密度函数之间的均方积分误差达到最小。主要的方法有直方图估计,Parzen的核估计以及最近邻估计。其中最为经典的非参估计方法是Parzen的核估计。
     随着计算机技术的发展,非参数密度估计的应用领域越来越广,涉及社会科学、生物科学、物理科学,以及各种工程技术领域。非参数密度估计也可以在统计推断中间发挥作用,如用于非参数判别、聚类分析等。
     判别分析是多元统计分析中应用广泛的统计方法,是指在分类情况已知的情况下,根据目标对象具有的各类属性的特征值来判定其所属类型的一类统计学分析方法。判别分析的过程就是根据一定的判别分析理论,建立判别分析模型,通过对历史数据的分析来确定判别分类规则,并利用规则对未知元素进行分类的过程。
     本文详细的介绍了核估计和最近邻估计的基本理论以及基于基于核估计和最近邻估计的非参数判别的原理。
     最后本文将非参数判别法应用于全国主要流域水质状况判别上面,很好地说明了非参数密度估计在判别分析中的实用性和适用性。通过两种方法的计算和分析比较,能够很好地比较非参数密度估计和非参数近邻估计的优缺点。
The probability density function is one of important concepts in statistics. The nonparametric estimation of the density functions is an important direction of the development of the modern statistics.The probability density function estimation is the technology of estimation for the unknown probability denstity function based on the observed data that can make the mean integrated square error between the true densisty and the estimated density reach the minimum.The denstity function can be nonparametricly estimated through many ways,mainly by the rectangle,the Parzen kernel and the nearest neighbor estimation.The classical nonparameter estimation method is Parzen kernel method.
     By the development of computer technology,the application that based on the nonparametric estimation begins to invole more and more fileds,such as the social sciences,biology,physics and engineering and technique.It can be applied by the middle link of statistics inference,such as the nonparametric discriminant analysis,assemble analysis.
     Discriminant analysis is a statistical method that can be widely applied in the mumultivariate statistical analysis.It refers to a statistical analysis of determining the class of the target object in the case of know classify types, based on the characteristics of various property values.Discriminant analysis process is to construct the classifying model based on a certain classification theory,to learn the classification rules from tuples of historical data and to classify the unknown tuple.
     This article detailed introduces the basic theory of kernel estimation and nearest neighbor estimation and principle of nonparametric discriminance which bases on kernel and neighboring estimate.
     Finally,this article uses the nonparametric discriminant method to discriminate main river water quality criterion.It well illustrates the nonparametric density estimation in the discriminant analysis of the practicability and applicability. By comparing two methods of calculation and analysis, this article indirectly compares the characteritics and metris of the nonparametric kernel density estimation and the nonparametric nearest neighbor estimate.
引文
[1]石磊 两种密度估计方法的比较[D]东北师范大学,2010年
    [3]姜珠华Rosenblatt估计与最近邻估计相合性的模拟比较[J]延边大学,2005年04期
    [4]孙山泽非参数统计讲义[M] 北京:北京大学出版社,2002
    [5]王星 非参数统计[M]北京:清华大学出版社,2009
    [6]张夏菲 非参数核密度估计负荷模型在电网可靠性评估中的应用[D]重庆大学,2010年
    [7]高惠璇 应用多元统计分析[M]北京:北京大学出版社,2005
    [8]沃塞曼 统计学完全教程[M]北京:科学出版社,2008
    [9]王金然 密度核估计中核函数的迭代算法及对最优窗宽的研究[D]燕山大学,2005年
    [10]郭呈全 非参数统计方法在风险管理中的应用[D]温州大学,2011年
    [11]陈希孺 最近邻密度估计的收敛速度[J].中国科学,1981年12期
    [12]于伟程 基于核密度估计的金融市场谱风险度量[D]北京化工大学,2010年
    [13]陈希孺 非参数统计教程[M]上海:华东师范大学出版社,1993
    [14]王志刚 非参数核密度估计在我国非寿险公司偿付能力额度计算中的应用[D]天津财经大学,2009年
    [15]王志刚 基于非参数核估计的Copula模型的研究[D]安徽工程大学,2011年
    [16]李雪月 非参数变换核估计在洪水频率计算中的应用研究[D]西北农林科技大学,2010年
    [17]朱干江 非参数密度估计在判别分析中的应用[D]南京信息工程大学,2007年
    [18]沃塞曼 现代非参数统计[M]北京:科学出版社,2008
    [19]孙荣索 赔相依的非参数近邻估计信度模型[J]统计与决策,2012年23期
    [20]刘红玲,刘建删失情形下污染分布的近邻估计[J]武汉科技学院学报,2007年6期
    [21]余锦华,杨维权多元统计分析与应用[M]广州:中山大学出版社,2005
    [22]贾云青 基于判别分析的医疗数据处理研究[D]中南大学,2009年
    [23]王斌会 多元统计分析及R语言建模[M]广州:暨南大学出版社,2005
    [24]陈雪莲 判别分析在机动车辆保险费率厘定中的应用[D]天津财经大学,2009年
    [25]陆璇 实用多元统计分析(第四版)[M]北京:清华大学出版社,2001

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700