基于语义相似度及命名实体识别的主观题自动评分方法
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Automated scoring method for subjective questions based on semantic similarity and named entity recognition
  • 作者:王逸凡 ; 李国平
  • 英文作者:Wang Yifan;Li Guoping;School of Communication & Information Engineering,Shanghai University;
  • 关键词:同义词词林 ; 主观题 ; 语义相似度 ; 命名实体识别 ; 自然语言处理
  • 英文关键词:CiLin;;subjective questions;;semantic similarity;;name entity recognition;;natural language processing
  • 中文刊名:DZCL
  • 英文刊名:Electronic Measurement Technology
  • 机构:上海大学通信与信息工程学院;
  • 出版日期:2019-01-23
  • 出版单位:电子测量技术
  • 年:2019
  • 期:v.42;No.310
  • 语种:中文;
  • 页:DZCL201902017
  • 页数:4
  • CN:02
  • ISSN:11-2175/TN
  • 分类号:90-93
摘要
人工智能技术目前已运用于诸多领域,其中在教育行业的一个重要应用为主观题评分系统。文本相似度计算是主观题评分的一大难点,目前采用的基于同义词词林的词语相似度计算方法已经了取得较好的效果,但文本过长会导致传统词语相似度计算方法性能下降。该文采用拓展的命名实体识别方法将主观题的候选答案中部分关键词提取出来,采用改进的同义词林词语相似度计算方法将候选关键词与主观题标准答案中目标关键词进行相似度计算。所提方法能有效提升词语匹配效率,在原同义词林词语相似度算法基础上,提升了性能,有效缩短了计算时间。
        Artificial intelligence technology has been widely used in many areas.One of the applicationsinthe education industry is automated scoring system for subjective questions.The text similarity calculation is a major difficulty in subjective question scoring.The word similarity calculation based onCiLin has achieved good results,but the long text will lead to the performance degradation of the traditional word similarity calculation method.In this paper,the extended named entity recognition method is used to extract some keywords from the candidate answers of the subjective questions.the improved CiLinword semantic similarity calculation method is used to calculate the similarity between the candidate keywords and the target keywords.The proposed method can effectively improve the word matching efficiency.On the basis of the original CiLinword semantic similarity algorithm,the performance is improved and the calculation time is effectively shortened.
引文
[1] 李亚,张小平.基于人工智能的网络评卷系统的初探[J].中国战略新兴产业,2018(28):115.
    [2] 曹玉婵,左映龙.浅析在线考试主观题智能阅卷算法的设计与实现[J].价值工程,2014,33(17):231-233.
    [3] 高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004(14):132-135.
    [4] 刘逸雪,卢雨轩,丁亮, 等.基于Bi-LSTM的数学主观题自动阅卷方法[J].管理观察,2018(2):109-113.
    [5] 张均胜,石崇德,徐红姣, 等.一种基于短文本相似度计算的主观题自动阅卷方法[J].图书情报工作,2014,58(19):31-38.
    [6] 李春梅,徐庆生.基于多特征的汉语句子相似度计算模型的研究[J].计算机技术与发展,2014,24(6):136-139,144.
    [7] 何晓梅.基于条件随机场的音乐共同语义标注[J].电子测量技术,2016,39(8):70-74.
    [8] 田久乐,赵蔚.基于同义词词林的词语相似度计算方法[J].吉林大学学报(信息科学版),2010,28(6):602-608.
    [9] 吕立辉,梁维薇,冉蜀阳.基于词林的词语相似度的度量[J].现代计算机(专业版),2013(1):3-6,9.
    [10] 朱新华,马润聪,孙柳, 等.基于知网与词林的词语语义相似度计算[J].中文信息学报,2016,30(4):29-36.
    [11] CHE W X, LIZ H, LIU T. Ltp: A chinese language technology platform[C]. 23rd International Conference on Computational Linguistics: Demonstrations, Association for Computational Linguistics, 2010.
    [12] 张梅山,邓知龙,车万翔, 等.统计与词典相结合的领域自适应中文分词[J].中文信息学报,2012,26(2):8-12.
    [13] 王丽杰, 车万翔, 刘挺, 等. 基于SVMTool的中文词性标注[J]. 中文信息学报, 2009, 23(4):16-22.
    [14] LTP语言技术平台. 使用训练套件[DB/OL]. http://ltp.ai/docs/train.html.
    [15] 梅家驹.同义词词林[M].上海:上海辞书出版社,1996.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700