对中文分词歧义消除算法的研究
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Research on the Algorithm of Eliminating Word Segmentation Ambiguity
  • 作者:谷瑞
  • 英文作者:GU Rui;Department of Mobile Internet Technology,Suzhou Industrial Park Institute of Service Outsourcing;
  • 关键词:中文分词 ; 歧义消除 ; 歧义处理 ; 歧义字段
  • 英文关键词:Chinese word segmentation;;ambiguity elimination;;ambiguity disposal;;ambiguous words
  • 中文刊名:SZSZ
  • 英文刊名:Journal of Suzhou Vocational University
  • 机构:苏州工业园区服务外包职业学院移动互联网技术系;
  • 出版日期:2015-12-15
  • 出版单位:苏州市职业大学学报
  • 年:2015
  • 期:v.26;No.77
  • 语种:中文;
  • 页:SZSZ201504008
  • 页数:4
  • CN:04
  • ISSN:32-1524/G4
  • 分类号:31-33+54
摘要
介绍中文分词算法的理论知识,通过介绍歧义存在的种类,分析分词结果出现歧义的必然性.提出改进"退一字组合法",实现歧义消除.在保持切分速度的前提下,提高切分的精度.为搜索引擎建立索引奠定良好的基础.
        Having introduced the theory of Chinese word segmentation algorithm,this paper proposes to improve"the back one word combination"by analyzing the categories of word segmentation ambiguity and its inevitability in order to eliminate it and enhance the precision of segmentation while maintaining the segmentation rate. As a result, it lays solid foundation for search engines to establish indexes.
引文
[1]陆公正,开金宇.使用机械分词与特征扫描实现对甲骨卜辞的切分[J].苏州市职业大学学报,2013,24(4):2-6.
    [2]梁颖红.紧凑结构多词表达抽取技术综述[J].苏州市职业大学学报,2013,24(3):2-6.
    [3]张培颖,李村合.一种改进的上下相关的歧义字段切分算法[J].计算机系统应用,2006(5):46-48.
    [4]张春霞,郝天永.汉语分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-147.
    [5]余战秋.中文分词技术及其应用初探[J].研究与开发,2004,32(6):80-82.
    [6]许高建,胡学钢,路遥,等.提出了一种采用“动词优先”的歧义消除算法[J].安徽工业大学学报:自然科学版,2008,31(10):1622-1625.
    [7]谭琼,史忠植.分词中的歧义处理[J].计算机工程与应用,2002,38(11):125-127.
    [8]朱小娟,陈特放.词频统计中文分词技术的研究[J].EIC,2007,14(3):78-79.
    [9]张江.基于规则的分词方法[J].计算机与现代化,2005(4):18-20.
    [10]孙茂松,左世平,黄昌宁.汉语自动分词词典机制的实验研究[J].中文信息学报,2000,14(1):1-6.
    [11]杨文峰,陈光英,李星.基于PATRICIA tree的汉语自动分词词典机制[J].中文信息学报,2001,15(3):44-49.
    [12]邓曙光,曾朝晖.汉语分词中一种逐词匹配算法的研究[J].湖南城市学院学报:自然科学版,2005,14(1):76-78.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700