聚类分析在古生物学和矿物学中的应用
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
本文将数理的方法应用于古生物学的研究中,用聚类分析方法对新生代植物化石进行了分析。本文将化石属名和化石采集地的对应关系用二进制表示,尝试应用聚类分析中Ward's method方法对古近纪和新近纪植物化石分别进行了聚类分析。研究结果与前人的研究较为吻合,因此,此聚类分析法可以对植物区系划分进行适当的判断,在此基础上提供新的研究方法和划分依据。本文还将聚类分析应用到对矿物原生晕的分析中,将矿物的地球化学分析数据进行统计。把矿物原生晕数据进行皮尔森相似性系数计算,运用聚类分析法中的最长距离法,得出元素聚类图,取相似系数时元素可分为不同的元素组合,并显示分类间的联系。揭示出不同元素的一些特征。初步显示不同矿物元素间的联系及联系的程度,以便为以后对矿物的成因和富集规律做初步的研究。
In the present paper, clustering analysis as one of the biostatistics methods was applied to study the Cenozoic macrofossil floras of China. The genus and locations of fossils were represented by the binary system, then the Ward's method were was used to analyze the paleophytogeograhy of China in the Paleogene and Neogene age, respectively. Our results were consistent with former studies on the geographic demarcation of the Cenozoic floras of China. So it can be concluded that the clustering analysis can be used for the demarcation of plantage, which will provide a new method and criterion for the research of paleophytogeograhy. In this paper, cluster analysis was applied to the analysis of mineral elements in the geochemical analysis of data clustering, in aim to calculate the Pearson coefficient of primary halo data. In addition, clustering map of elements can be obtained using the most long-distance method.The When we choosing an intraclass correlation coefficient can be divided into different groups to calculate the correlation coefficients in order to display the links between categories and the characteristics of different elements. The results can be helpful for us to study the relation among the different mineral elements, furthermore, to research the causes and the roles of mineral enrichment.
引文
1.A.K.Jain,R.C.Dubes.Algorithms for Clustering Data.N J:Prentice-Hall,1988,1-5
    2.A.K.Jain,R.C.Dubes.Algodthms for Clustering Data.N.J:prentice-hall,1988,1-5
    3.G.Karypis,E.H.Han,V.Kumar.CHAMELEON:A Hierarchical Clustering Algorithm Using Dynamic Modeling.IEEE Trans on Computer.1999,32(8):68-75.
    4.Jiawei Han,Micheline Kamber著,范明,孟小峰等译.数据挖掘概念与技术.北京:机械工业出版社,2001.
    5.L.Kaufman,P.J.Rousseeuw.Finding Groups in Data:an Introduction to ClusterAnalysis.N Y:John Wiley&Sons,1990.
    6.φyvind Hammer,D.A.T.Harper,P.D.Ryan.PAST:Paleontological Statistics Software Package for Education and Data Analysis.Palaeontologia Electronica,2001,4(1):9pp.
    7.R.Ng,J.Han.Efficient and effective clustering method for spatial data mining.In:Proc of the Int Confon Very Large Data Bases.San Francisco,1994,14:4-155.
    8.S.Guha,R.Rastogi,K.Shim.CURE:An efficient clustering algorithm for large databases.In:Proc of the 1998 ACM SIGMOD international conference on Management of data.New York,N Y,1998,73-84.
    9.Sudipto Guha,Rajeev Rastogi,and Kyuseok Shim.Cure:An efficient clustering algorithm for large databases.In Proceedings of the Fourth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining(SIGKDD'98),pages 73-84,1998.
    10.T.Zhang,R.Ramakrishnan,M.Livny.BIRCH.An efficient data clustering method for very large databases.ACM SIGMOD Record.1996,125(2):103-114.
    11.陈汉军,杨雪.欧几里德距离的几种定义与应用.天津轻工业学院学报.2003,18:65-78.
    12.陈键.浅析常用聚类分析算法.安徽电子信息职业技术学院学报.2007,6(28):100-102.
    13.陈强.《统计学原理》.2000,中国商业出版社.
    14.陈晓春.基于K-Means和EM算法的聚类分析.福建电脑.2009,(2):79-80.
    15.陈治国,张春元.基于聚类分析的学生等级制成绩评定方法.电脑知识与技术,2006(1):131-132.
    16.杜荣骞.《生物统计学》.2003,高等教育出版社.
    17.顾岚.《时间序列分析:预测与控制》.1997,中国统计出版社.
    18.何满辉,赵红霞.通过比较认识数据挖掘.现代管理科学.2007,64-65.
    19.贺娟,汪品先.晚中新世植被变更与光合作用演化.地球科学进展.2005,20(6):619-626.
    20.胡良平,胡纯严.如何用SAS软件正确分析生物医学科研资料 用SAS实现单组设计定量资料的统计分.2009,4(1):71-73.
    21.胡志萍,王斌会.统计学在中国的发展与就业前景.统计与预测.2003:37-38
    22.姜立征,张玉兰,王开发,等.上海地区更新世孢粉组合及其古植被、古气候.上海地质.2000,(4):34-41.
    23.金建华,廖文波,王伯菘,等.新生代全球变化与中国古植物区系的演变.广西植物,2003,23(3):217-225.
    24.梁明媚,王宇飞,李承森.山旺中新世植被演替及古气候定量研究.古地理学报.2001,3(3):11-20
    25.刘耕武,李浩敏,冷琴.黑龙江桦南中新世道台桥组化石植物群初步报道.古生物学报.1995,34(6):755-757。
    26.刘晓煌.北祁连西段金佛寺岩体的成岩成矿作用研究:[博士论文].兰州大学,2008.
    27.刘艳,李录.中国主要侏罗纪植物群相似性系数的初步研究.植物学通报,2006,23(4):380-388.
    28.刘艳霞.数据挖掘中聚类分析技术的研究与应用.科技情报开发与经济.2008,18(6):155-156.
    29.卢纹岱等.SPSS for Windows从入门到精通.北京:电子工业出版社,1998.
    30.陆云.聚类分析数据挖掘方法的研究与应用:[硕士论文].安徽大学.2007.
    31.苗运法,方小敏等.青藏高原北部始新世孢粉记录与古环境变化.中国科学.2008,38(2):187-196.
    32.秦松柏,欧阳正平,程天舜.分层聚类分析在水文地球化学分类中的应用.地下水,2008,30(1):21-24
    33.史冀忠,刘招君等.辽宁抚顺盆地始新世古气候定量研究.吉林大学学报.2008,38(1):50-55.
    34.舒军武,王伟铭等.黑龙江鸡东盆地中中新世湖盆演变和植被变化研究.地质学杂志.2007,31(3):247-254.
    35.苏新宁.数据挖掘理论与技术.北京:科学技术文献出版社,2003.
    36.孙柏年,丛培允,阎德飞,等.云南腾冲新近纪两种被子植物化石的角质层构造及其古环境意义.古生物学报,2003,42(2):216-22.
    37.孙启高,王宇飞,李承森.中新世山旺盆地植被演替与环境变迁.地球前缘,2002,9(3):109-117.
    38.孙湘君,宋长青,陈旭东.中国第四纪孢粉数据库(CPD)和生物群(Biome 6000).地球科学进展,1999,14(4):407-411.
    39.陶君容,杨家驹.内蒙古地区中新世木化石及古气候意义.云南植物研究.1994,16(2):111-116.
    40.陶君容.被子植物花化石研究.植物学报.1992,34(3):240-242.
    41.陶君容.中国第三纪植被和植物区系历史及分区.植物分类学报,1992,30(1):25-43.
    42.陶君容.中国晚白垩世至新生代植物区系发展演变[M].北京:科学出版社,2000.
    43.佟希达,杨秀娟,李珍,等.晚白垩纪-新生代黑龙江植被发展概论.植物研究,1995,15(2):269-274.
    44.童国榜,刘志明等.江汉盆地始新世中.晚期古气候定量重建初探.中国地质大学学报.2002,27(4).447-452.
    45.王安志,李明东,李超.各种聚类算法及改进算法的研究.电脑知识技术.2008,3(7):1539-1541.
    46.王晓梅,王明镇.中国晚始新世-早渐新世地层孢粉组合及其古气候特征.中国地质大学学报.2005,30(3).309-316.
    47.魏宗舒.概率与数理统计[M].1983,高等教育出版社.
    48.夏幼明,解敏,周雯.数据挖掘方法分析与评价.云南师范大学学报.2003,23(2):7-16.
    49.肖筱南.生物统计研究展望.统计与社会.1995:34
    50.行小帅,焦李成.数据挖掘的聚类方法.电路与系统学报.2003,3(2):46-51.
    51.徐涵秋,郭文.古生物化石的自动鉴定.地质评论.1990,36(4):370-375.
    52.徐涵秋.微型电子计算机在筵类化石鉴定中的应用.微体古生物学报.1987,4(1):103-109.
    53.易波.聚类分析及其在移动通信企业数据挖掘分析中的应用研究:[硕士论文].湖南大学,2008.
    54.应潞,徐艳春.东北林蛙8个地理种群的形态聚类分析.农业科学与技术.2008,19(1):100-110.
    55.张立亚.黑龙江老柞山金矿矿床地质特征及矿化富集规律研究:[硕士论文].吉林大学,2008.
    56.张南.20世纪统计学的回顾与展望.统计研究.2000,(9):3-7.
    57.赵良成.云南中新世和山西上新世果实和种子的研究:[博士论文].中国科学院研究生院,2002.
    58.中国新生代植物编写小组.中国新生代植物[M].北京:科学出版社,1978.
    59.朱宗元,刘德鑫.关于数据甄别的数理统计方法探讨.统计新论.2007:7-8.
    60.訾秀玲.大学计算机基础[M].北京:清华大学出版社,2006.
    61.张尧庭,方开泰著.多元统计分析引论[M].北京:科学出版社,1982.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700