基于决策树算法的物理学科个性化学习评价系统
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着计算机技术与通信技术的发展,我们己经步入了一个信息经济时代,信息技术在各个领域的应用正飞速的改变着人们工作、生活和学习的方式。远程教育的发展面临着前所未有的挑战。在远程教学环境下,教与学时空分离、学生个别化自主学习等特点使得教学管理者对学生进行评估时缺乏有力的数据和依据,其原因在于大多数现有的基于Web的远程教育系统缺少对学习过程的监控以及对学生在线学习行为的评估。当前的许多网络教学平台不同程度的存在着一些问题,主要表现在教学方法单一,教学双方互动性差等问题,因此现有的个性化学习平台并不能很好的解决个别化学习的需求,所以也就无法对学习者实施很好的个性化的学习服务,学习者无法针对自己的不足及时进行调整。针对这一问题本文提出了基于数据挖掘技术的个性化学习平台,个性化学习平台主要针对物理学科的学习进行评估。
     由于数据挖掘技术能够从海量的数据中发现一些未知的、有价值的规律,无疑为个性化的教育服务提供了强有力的支持。本文对决策树分类算法进行了分析和研究,认真分析和对比了ID3算法和C4.5算法的优缺点,引用了一种基于属性相关性的C4.5决策树规则简化算法。并将其应用到了物理学科个性化学习评估中,并通过实验数据证明评价方法的优劣。
According to the development of computer and communication technique ,it is a age of information and economy, people is changing their ways of lives by the application of information technology in each field .The development of distance education is facing a challenge. The evaluation of the students’learning is very important through teaching process. Under the distance education environment, teaching is separate to learning and the students learning by themselves, all these characters make the teaching supervisor feel lack of useful data when evaluating. This is because of the lack of the monitoring on students’learning process and the evaluation of the students’behavior online by the distance educational system based on web. Nowadays, there are many kinds of problems in many educational environments based on web, primarily are the lack of methods on teaching and communication between teachers and students. What we have gotten for personalized learning environment can not solve the needs on personalized learning, thus these can not serve the learner very well on personalized learning, also the learner can not adjust themselves in time according to their shortcoming. To solve this problem, we present a environment model of personalized learning based on data mining technology, especially for the evaluation online of physics.
     Since we can find many unknown and useful regulations through using data mining technology, it is undoubtedly giving the personalized education service powerful support. Here we analyzed decision tree classification algorism, compared the ID3 algorism and the C4.5 algorism. Though the study on the C4.5 algorism, we used a easier algorism of C4.5 decision tree regulation based on attribute correlation which is already existed, and applied it into the individualized learning evaluation .We testified it by experiment data.
引文
[1]张洁 赵蔚等 基于网络的个性化、协作式学习环境的设计 中国电化教育 2003(8).
    [2]许世博、范克勇 个性化教育—基础教育改革重大而急迫的课题,山东教育,2000 年 25 期.
    [3]钟启泉、黄志成 《美国教学论流派》,陕西人民教育出版社,1997 年版
    [4]贺清碧,胡久永.数据挖掘技术综述.云南民族大学学报(自然科学版).2003 , 29(3).
    [5]李永敏, 朱善军, 陈湘晖 等. 基于粗糙集理论的数据挖掘模型. 清华大学学报,(自然科学版) 1999.1.
    [6]朱鄂桂 谷皓 余晓征 浅析基于网络环境下的教学模式 教育信息技术 2004(12).
    [7]徐影 互联网媒体与网络教育 教育信息技术 2004(2).
    [8]徐洁磐著,数据仓库与决策支持系统.北京:2005 年 4 月第一版.
    [9]黄荣怀.一种基于WEB的协作学习系统模型 J ,中国远程教育,2001(2).
    [10]查有梁 主编 新教学模式之建构 2003.5.
    [11]韩家炜 孟小峰等, Web 挖掘研究[J], 计算机研究与发展 2001(4).
    [12]刘丽君,黄亚楼,薛彬,等.数据挖掘原型系统RoboMiner的设计和初步实现.计算机科学,2000.
    [13]邵华,万家华,王剑虎,等.一个以用户为中心的数据挖掘工具:Open Miner.计算机科学,2000.
    [14]杨帆. Web 远程教育的在线交流模型及其实现[J ] . 中国远程教育月刊,2002.
    [15]夏火松.数据仓库与数据挖掘技术[M].北京:科学出版社,2004.
    [16]DavidHandHeikkiPadhraicSmyth著.数据挖掘原理[M].廖丽,宋俊等译.北京:机械工业出.
    [17]刘洁. 多媒体远程教育技术的发展现状及问题初探[J ] . 电化教育研究,2000 , (8).
    [18]申瑞民,许彦青,张同珍,等. 基于多代理的智能型远程教学环境研究[J ] . 计算机工程与应用,2002.
    [18]董武绍. 关于基于多Agent 系统的远程教学模式研究[J ] . 电化教育研究,2001.
    [20]林杰,薛华成.数据挖掘管理系统[J].微型电脑应用,2000,16(11):122.
    [21]谢新观.远程教育概论.北京:中央广播电视大学出版社,2000.
    [22]龚婕, 王普, 周丽萍. 现代远程教学系统的设计与实现[J ]. 计算机工程, 2002, (5).
    [23]郑志高, 鬲淑芳. Internet 学术(学习) 资源管理平台设计研究[J ]. 电化教育研究, 2002.
    [24]丁兴富. 教学设计理论和远程教学系统开发[J ]. 中国电化教育, 2001.
    [25]曲红亭,申瑞民.基于数据挖掘的个性化学习导航系统的设计与实现[J].计算机工程,2003.
    [26]董彩云,曲守宁.数据挖掘及其在高校教学系统中的应用[J].济南大学学报(自然科学版),2004.
    [27]周则顺,水俊峰,夏红霞,等.基于 Web 日志挖掘的智能站点体系[J].武汉理工大学学报(信息与管理工程版),2003.
    [28]黄风华,王 咏.基于客户端的 Web 使用挖掘[J]1 计算机时代,2003.
    [29]陈金龙 1 浅谈基于学生个性化学习的人才培养模式的本质特征和实现条件[J]1 中国远程教育,2001.
    [30]庞先伟 基于数据挖掘技术的资源型学习 2002-1-2.
    [31]丁琳,吴长永 1 数据挖掘在远程教育个性化服务中的应用[J]1 电化教育研究,2002.
    [32]彭丽文,中小学信息技术教学模式推介[J]中小学信息技术教育,2004.
    [33]夏火松, 数据仓库与数据挖掘技术[M],北京:科学出版社 2004.
    [34]David Hand Heikki Mannila Padhraic Smyth, 数据挖掘原理[M], 张银奎,廖丽,宋俊等译:北京机械工业出版社 2003.
    [35]赵伟等, Web 日志挖掘中的数据预处理技术研究[J], 计算机应用 2003(5).
    [36]宋茜.构建基于网络的个性化学习环境,上海:上海师范大学教育技术系.328-330.
    [37]范明,孟小峰.数据挖掘概念与技术.北京:机械工业出版社.2001.
    [30]乔际平,刑红军.物理教育心理学[M].南宁:广西教育出版社,2002. 31-35.
    [39]MargaretHDunham 著.数据挖掘教程[M].郭崇慧,田凤占等译.北京:清华大学出版社,2003.
    [40]吴诩,李永乐.应用数理统计.长沙:国防科技大学出版社,1995.
    [41]J.R.Quinlan. Induction of decision trees. Machine L.earningl(1):81-106,1986.
    [42]1.R.Quinlan.C4.S:Programsfor Machine Learning. San Mateo,CA:Morgan Kaufmann,1993.
    [43]L.Breiman, L.Friedman and J.H.Olshen et al. Classification and Regression. Trees(MJ. Belmont,CA:Wadsworth International Group),1984.
    [44]M.Mehta, R.Agrawal and J. Rissanen. SLIQ: A fast scalable classifier for data mining. InProc. of the Fifth Int'1 Conference on Extending Database Technology, Avignon, France,1996.
    [45]J.Shafer, R.Agrawal and M.Mehta. SPRINT: A scable parallel classifier for datamining. Research report, IBM Almaden Research center, San Jose, California, 1996.
    [46]Quinlan J R. C4.5: Programs for Machine Learning. San Mateo, California: Morgan Kaufmann 1993.
    [47]W.Duchy N. Jankowski, K. abczewski and R. Adamczak. Optimization and Interpretation. of Rule-Based Classifiers. Physica Verlag (Springer): Intelligent Information Systems IIS'2000
    [48]Han J, Kambr M. Data Mining: Concepts and Techniques. Beijing: Higher Education Press, 2001.
    [49]Yin-Fu Huang,Chiech-Ming Wu.Mining Generalized Association Rules Using Pruning Techniques. Proceedings of the 2002 IEEE International Conference on Data Mining 227-234.
    [50]S. Brin. R. Motwani, C. Silverstein. Beyond market baskets: generalizing association rules.to correlations. In SIGMOD Conference. 1997.
    [51]Shao, Hua, Wan, Jia-hua, Wang, Jian-hu, et al. A user-centered data mining tool: open miner. Computer Sciences, 2000,27(10):68~72 (in Chinese).
    [52]Zhou, Ao-ying, Qian, Wei-ning, Qian, Hai-lei, et al. A hybrid approach to clustering in very large databases. In: Proceedings of the 5th PAKDD. 2001. 519~524.
    [53]Agrawal R., Imielinski T and A. Swami. Mining Association Rules Between Sets of Items in Large Databases. Proceeding of ACM SIGMOD International Conference. (1993), 207-216.
    [54]Tian, Zeng-ping, Lu, Hong-jun, Ji, Wen-yun, et al. An n-gram-based pproach for detecting approximately duplicate database records. International Journal on Igital Library, 2001,5(3):325~331.
    [55]Milojicic, D., Mobile agent applications, IEEE Concurrency, 1999.
    [56]Pleisch,S.and Sohiper,A. ,Approaches to fault-tolerant mobile agent execution, Research Report,2001.
    [57]Wong D, et al. Java-based Mobile Agents[J]. CACM, 1999.
    [58]范洁 基于数据挖掘的在线学习行为评估系统设计与实现 优秀硕博论文 2005.5.
    [59]王晓国,黄韶坤,朱伟等.应用 C4.5 算法构造客户分类决策树的方法.计算机工程.2003 29(14): 89-91.