词频信息的效度及改进思路
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:The Validity of Word Frequencies and Its Improvement
  • 作者:翟颖华
  • 英文作者:ZHAI Ying-hua;School of International Education, Wuhan University;
  • 关键词:词频 ; 效度 ; 语体 ; 领域 ; 词性 ; 话题
  • 英文关键词:word frequencies;;validity;;style;;domains;;part of speech;;topic
  • 中文刊名:HYXX
  • 英文刊名:Chinese Language Learning
  • 机构:武汉大学国际教育学院;
  • 出版日期:2019-06-15
  • 出版单位:汉语学习
  • 年:2019
  • 期:No.231
  • 基金:武汉大学自主科研项目“面向二语教学的初级汉语选词研究”(项目编号:413000001)资助
  • 语种:中文;
  • 页:HYXX201903010
  • 页数:9
  • CN:03
  • ISSN:22-1026/H
  • 分类号:97-105
摘要
词频信息是衡量词语常用程度的重要依据,如何从语料库中有效地揭示词语的使用频率是词频统计所面临的技术难题。文章以第二语言教学为视角对词频信息的效度提出三点认识,并从同质性的角度探讨改进词频信息效度的思路。对词频信息的描写应该是多层面多维度的,单个频率词表不能满足语言研究的不同需要。
        Information on word frequencies is an important basis for measuring the degree of word usage. However, concerning word frequency statistics, it is technically difficult to effectively discover the word frequencies from the corpus. From the perspective of second language teaching,this article offers three views on the validity of word frequencies information, and discusses the thoughts on improvements of validity of word frequency from the view of homogeneity. The author believes descriptions about word frequency should be from multiple layers and multiple directions.A single word frequency list can not satisfy different needs of language research.
引文
[1]北京语言学院语言教学研究所编.现代汉语频率词典[M].北京:北京语言学院出版社,1986.
    [2]道格拉斯·比伯,苏珊·康拉德,兰迪·瑞潘.语料库语言学[M].北京:清华大学出版社,2012.
    [3]冯志伟.中国语料库研究的历史与现状[J].Journal of Chinese Language and Computing,2002,(1).
    [4]冯志伟.论语言符号的八大特性[J].暨南大学华文学院学报,2007,(1).
    [5]郭锐.现代汉语词类研究[M].北京:商务印书馆,2002.
    [6]郭绍虞.照隅室语言文字论集[M].上海:上海古籍出版社,1946.
    [7]郎建国.英语常用词与四部英语学习词典的词频标注[J].外语教学与研究,2009,(1).
    [8]李晓琪.中介语与汉语虚词教学[J].世界汉语教学,1995,(4).
    [9]马清华.唯频率标准的不自足性--论面向汉语国际教育的词汇大纲设计标准[J].世界汉语教学,2008,(2).
    [10]王惠.日常口语中的基本词汇[J].中国语文,2011,(5).
    [11]赵金铭,张博,程娟.关于修订《(汉语水平)词汇等级大纲》的若干意见[J].世界汉语教学,2003,(5).
    [12]朱德熙.现代书面汉语里的虚化动词和名动词--为第一届国际汉语教学讨论会而作[J].北京大学学报,1985,(5).
    [13]Adam Kilgarriff.Putting Frequencies in the Dictionary[J].International Journal of Lexicography,1997,(10).
    [14]Alderson,J.C.Judging the Frequency of English Words[J].Applied Linguistics,2008,(3).
    [15]Chafe,Wallace.Writing in the Perspective of Speaking[A].In Studying Writing,edited by Charles Cooper and Sidney Greenbaum,London:Sage,1986.
    [16]Geoffrey N.Leech,Paul Rayson,Andrew Wilson.Word Frequencies in Written and Spoken English:Based on the British National Corpus[M].London:Pearson ESL,2001.
    [17]Geoffrey N.Leech.The Role of Frequency in ELT:New Corpus Evidence Brings a Re-appraisal[J].外语教学与研究,2001,(5).
    [18]Geoffrey N.Leech.Why Frequency Can no Longer be Ignored in ELT[J].外语教学与研究,2011,(1).
    [19]Guy Cook.The uses of reality:a reply to Ronald Carter[J].ELT Journal,1998,(1).
    [20]Halliday M.A.K.Linguistic Functions and Literary Style[C].In S.Chatman(ed.).Style:A Symposium.Oxford:OUP,1971.
    [21]Harley,Trevor.The Psychology of Language:From Data to Theory[M].London:Psychology Press,1995.
    [22]Hornby,Albert Sydney.牛津高阶英语词典(第7版)[M].北京:The Commercial Press,2007.
    [23]Martin W.The Frequency Dictionary[C].MHausmann F J.etal.An International Encyclopedia of Lexicography,1990.
    [24]Richard Xiao,Paul Rayson,Tony McEnery.A Frequency Dictionary of Mandarin Chinese[M].London:Routledge,2009.
    (1)由国家语委研制,词频信息来源:http://www.cncorpus.org/resources.aspx,下同。
    (2)由北京语言大学对外汉语研究中心研制,词频信息来源:http://www.dwhyyjzx.com/cgi-bin/yuliao/,下同。
    (3)由台湾中央研究院研制,词频信息来源:http://elearning.ling.sinica.edu.tw/CWordfreq.html#top,下同。
    (1)http://www.pearsonlongman.com/ldoce/members/freq_corpus.html
    (2)见陆俭明为郭锐《现代汉语词类研究》所做的序。
    (1)《柯林斯英语学习词典》的体例中,一级高频词的频序在1-700范围内,二级高频词的频序在701-1900范围内。
    (1)由Routledge出版公司出版,自2005年以来,该公司陆续推出8个语种的系列频率词典。
    (2)除去现代汉语语料库中可以类推的数词“第一、第二、第三、第四、十一、十二、十三、十五、十六、十七、十八、十九、二十、三十、四十、五十、六十、一百”、前接成分、后接成分、数量短语。
    (3)现代汉语语料库以书面语语料为主,叹词主要活跃在口语中,不能说明问题。
    (1)除去频率词表中的54个阿拉伯数字词。
    (2)现代汉语语料库前3000词中没有拟声词和语气词,这两类不统计。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700