基于智能文本分类技术的素材管理软件的设计与开发
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
本文就人们对大量文本资料和媒体素材缺乏有效的分类管理手段这一实际问题出发,综合并借鉴了前人在智能文本分类、多媒体数据库技术中的研究成果,结合自身实际情况,就开发“基于智能文本分类技术的素材管理软件”进行了探索和研究。全文首先讨论了课件本身的局限性,引出了“积件”的思想,继而论述了建立基于积件思想的素材库的必要性。然后就如何实现对素材进行高效率的分类和管理,提出了自己的看法,指出将人工智能技术运用于教学实践中的可能性、必要性和迫切性。本文第二章介绍文本分类和多媒体数据库中的关键性技术,比较并总结这一领域中的研究动态。第三章中,详细介绍了软件的设计方案。在前人研究成果上,予以创新,设计了一套无需词典支持、简单易行的中文分词和分类算法,开发了“文档自动分类软件”,并对如何将这一技术与多媒体素材库相结合,实现对媒体素材的模糊查询和智能分类等问题进行了探讨,给出了软件设计的总思路和总方案。这些思路在随后的第四章中得到落实,包括对已经实现部分的主要功能介绍和其中关键性技术的实现方法,最后分析了工作中存在的不足,以及有待今后改进的方面。综上所述,本文是在教育信息化过程中,就教学信息素材的有效分类管理进行的一次有益的实践探索和尝试。
Confronting the need of effective approaches to manage a mass of texts and multimedia materials, the author attempts to develop an educational material management software with automatic text classification ability, based on the research achievements done by other people and the creations or adaptable applications of his own. This paper first discusses the limitation of "courseware" to introduce the conception of "integrable-ware". Then it puts forward the necessity of building up material databases based on the integrable-ware conception. After that, the author gives his views on how to categorize and manage this database, and then points out the possibility, necessity and urgency of applying AI (Artificial Intelligence) technology in teaching practice. In the second chapter, the author introduces the key technology of text categorization and multimedia database and then sums up the research development in this field. In the third one, the author introduces the design of program in details. With a reference of others' work, he designs a set of Chinese language segmentation and categorization algorithm without the support of dictionaries. Thus he develops an automatic text classification software and suggests further solutions to problems such as how to apply this technology to a multimedia database, and realize the media search based on contexts not keywords. With that, the author gives the main plan and overall design of his software. All these are realized in the last chapter, in which, the author introduces some of the functions already realized together with its technical details. Finally, the author summarizes the deficiencies in his current work and the way of further improvement. In a word, this paper, with all its work, is a practical and beneficial exploration in the effective categorization and management of teaching material during the process of Educational Informatization.
引文
1.黎加厚,《从课件到积件:我国学校课堂计算机辅助教学的新发展》,电化教育研究,1997年3—4期
    2.郑小军 王屹 卢文华,《论多媒体CAI课件(积件)开发的模式和多媒体素材库(积件库)的规划与建设》,电化教育研究2000年第9期,第49页
    3.于更新,《课件、积件和多媒体素材库的应用特性》,河南教育学院学报(自然科学版)第10卷第1期,第79页。
    4.曾亦琦,《基于网络的教学信息资源库及其教学应用》,广州师院学报(自然科学版),2000年第8期,第21卷
    5.郑勤华 陈丽 李爽,《关于远程教育资源标准及资源库设计的探讨》,电化教育研究2002年06期,第31页
    6.[法]加斯东.维奥,《智能·什么是人工智能》,春秋出版社,1989年10月北京第1版
    7.陈仕品 谌家军,《现代教育技术发展的现状及前景》,四川师范学院学报(自然科学版),2002年6月,第23卷,第2期
    8.祝智庭,《教育信息化:教育技术的新高地》,中国电化教育,2001年02期,第5页
    9.庞剑锋 卜东波 白硕,《基于向量空间模型的文本自动分类系统的研究与实现》,计算机应用研究,2001年第9期,第23页
    10.朱华宇 孙正兴 张福炎,《一个基于向量空间模型的中文文本自动分类系统》,中文信息学报,2002年03期,第15页
    11.游荣彦 邓志才 李传宏,《向量空间模型中特征词的区分度的定量研究》,中文信息学报,2002年03期
    12.黄萱菁 吴立德 石崎洋之 徐国伟,《独立于语种的文本分类方法》,中文信息学报,2000年06期
    13.陆建江 张文献,《中文文本分类器的设计》,计算机工程与应用,2002年第15期,第49页
    14.杨清 杨岳湘 瞿国平,《智能文本分类系统的研究与设计》,计算机应用研究,1999年第10期,第15页
    15.胥桂仙 苏筱蔚 陈淑艳,《中文文本挖掘中的无词典分词的算法及其应用》,2002年3月,第23卷,第1期
    16.刘挺 吴岩 王开铸,《串频统计和词形匹配相结合的汉语自动分词系统》,中文信息学报,1997年,第12卷,第1期
    17.赵曾贻 陈天娥 朱兰,《一种基于语词的分词方法》,苏州大学学报(自然科学),2002年7月,第18卷第3期
    18.陶跃华,《基于向量的相似度计算方案》,云南师范大学学报,2001年9月,第5期第21卷,第17页
    19.杨斌 孟志青,《一种文本分类数据挖掘的技术》,湘潭大学自然科学学报,2001年12月,第23卷第4期
    20.刘群 李素建,《基于“知网”的词汇语义相似度计算》,第三届汉语词汇语义学研讨会,台北,2002年5月
    21. Fabrizio Sebastiani, 《Machine Learning in Automated Text
    
    Categorization》, ACM Computing Surveys, Vol. 34, No. 1, March 2002, pp. 1 -47.
    22. Robert W. P. Luk K.L. Kwok, 《A Comparison of Chinese Document Indexing Strategies and Retrieval Models》, Manuscript submitted to ACM Trans. Asian Language Information Processing, Version 3.0 10/05/02
    23. Ellen Riloff And Wendy Lehnert, 《Information Extraction as a Basis for High-Precision Text Classification》 ,ACM Transactions on Information Systems, Vol 12, No 3, July 1994, Pages 296-333
    24.张连明,《多媒体素材库的设计与实现》,中国电化教育,2002年1月,第44页
    25.刘玉照 黄蕾,《多媒体数据库模型及其实现图景之比较研究》,情报科学,2001年8月,第19卷第8期
    26.郭红 王宇 刘胜辉,《影视节目多媒体数据库管理系统的研究与设计》,哈尔滨理工大学学报,2002年8月,第7卷,第4期
    27.肖健宇,《多媒体数据库系统设计的关键技术研究之一:特征的提取与索引》,系统仿真学报,2001年11月,第13卷增刊
    28.姚留峰 戴玉勤 谢俊元,《多媒体素材库管理器的设计和实现》,计算机工程与应用,2002年5月,第171页
    29.李娟,《多媒体数据库开发》,信息系统,2001年第1期,第24卷
    30.温雅丽 吴晓群,《面向对象技术在多媒体数据库中的应用》,科技情报开发与经济,2002年,第12卷,第4期
    31.(美)Jeffrey P. McManus, 《Visual Basic 6数据库访问技术》,机械工业出版社,1999年10月第1版
    32.David Shark & Mark RobertS & Tmara Myers, 《Microsoft Office2000 Visual Basic Programmer's Guide》,北京希望电子出版设,1999年9月第一版
    33.陈圣国(编著),《信息系统分析与设计》,西安电子科技大学出版社,2001年3月第1版
    34.梁斌 曾亦琦,《多媒体课件界面设计的探讨》,广州师院学报(社会科学版)第20卷第4期,第99页
    35.杨永欣,《自主探究性学习:培养学习能力的最佳模式》,教育探索,2002年第3期
    36.陶兴荣,《自主探究学法开发创新潜能》,北京教育,2002年第1期,第35页
    37.陈俊林 吕自新,《运用多媒体网络技术建构自主探究型教学模式的尝》,中国电化教育,2002年7月,第41页
    38.张际平,《信息技术教育应用研究的儿个热点问题》,中国电化教育,2002年1月,16页
    39.余胜泉,《CELTS-31:教育资源建设技术规范(征求意见稿)》,http://www.etc.edu.cn
    40.曾亦琦,《基于网络的教学信息资源库及其教学应用》,广州师院学报(自然科学版),2000年08期,第21卷
    41.赵龙文 侯义文斌,《智能软件:由面向对象到面向Agent》,计算机工程与应用,2001年5月,第41页

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700