基于双序列比对的中文术语语义相似度计算的新方法

设为首页

收藏本站

网站地图 | English | 公务邮箱

远程访问

NSTL服务站

基于双序列比对的中文术语语义相似度计算的新方法

详细信息全文下载|推荐本文 |

出版年：2010
作者：徐硕；朱礼军；乔晓东；薛春香
单位1：中国科学技术信息研究所
出生年：1979
学历：博士后
语种：中文
作者关键词：语义相似度计算；序列比对；语义知识库
起始页：701
总页数：8
经费资助：本研究受“十一五”国家科技支撑计划“知识组织系统的集成及服务研究与实现”（2006BAH03B03）和中国科学技术信息研究所重点工作项目“汉语科技词系统建设与应用工程（新能源汽车领域）”（2008KP01-3-1）资助。
刊名：情报学报
是否内版：否
刊频：双月刊
创刊时间：1982
主管单位：中国科学技术协会
主办单位：中国科学技术情报学会；中国科学技术信息研究所
主编：武夷山
地址：北京市复兴路15号
邮编：100038
电子信箱：qbxb@istic.ac.cn
网址：http://www.cssti.org.cn
卷：29
期：4
期刊索取号：P965.5066 547
数据库收录：INSPEC（科学文摘）；LISA（图书馆和信息科学文摘）；РЖ（俄罗斯文摘杂志）；中国科技论文与引文数据库（中国科学技术信息研究所）；中文社会科学引文索引（南京大学）；中国学术期刊文摘（中国科协）；中国期刊全文数据库（同方）；数字化期刊全文数据库（万方）

摘要

针对中文术语的语义相似度计算问题，本文首先用数学语言对其进行了描述，然后仔细分析了求解该问题的传统计算方法，结果发现传统计算方法大都做了一个隐式假设：组成两个术语的原子术语的顺序必须大体一致。换句话说，传统计算方法并没有考虑原子术语顺序的差异对构建两个术语的原子术语间对应关系质量的影响。为克服这个问题，通过类比分析，本文认为可将该问题看作一个全局双序列比对问题，因而引入生物信息学领域中著名的全局双序列比对算法（NW算法）。理论及实验研究均表明，在绝大多数情况下，该方法优于传统方法，或至少与传统方法的效果相当。

地址：北京市海淀区学院路29号邮编：100083

电话：办公室：(+86 10)66554848；文献借阅、咨询服务、科技查新：66554700