中医“毒热”数据仓库系统的研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
中医理论的发展源远流长,如何充分利用其间积累的大量中医文献资料,为医学理论的进一步探讨提供支持成为目前亟需解决的重大问题。计算机技术的发展,特别是数据仓库、OLAP和数据挖掘理论与技术的发展,为决策支持提供了强有力的技术基础保障,实现了将信息转化为数据,利用数据发掘出知识。因此,如何充分利用这些理论与技术为中医理论的发展提供支持,将文献资料信息转换成规范化数据,建立数据多维立方体,对其进行多角度、多层次的分析和数据挖掘完成对特定中医理论的论证成为亟需探讨的课题。
     本文围绕中医毒热数据仓库系统的设计和构建,实现对毒热为胃脘病等常见疾病的主要病因且总体治法为清热解毒、消痈生肌这一推断的论证提供支持这一中心阐述对数据仓库体系结构的研究,包括数据仓库体系结构,元数据的作用与整建,数据仓库概念模型、逻辑模型、物理模型的设计与实现。数据仓库开发方法的研究,利用RUP即统一开发过程实现数据仓库的增量迭代开发,设计与实现保证数据质量的流程,数据仓库数据总线结构的设计与开发。数据仓库应用的研究,包括OLAP,即在线联机分析;数据挖掘;OLAM,即在线联机挖掘等等。
     根据上述理论和开发技术,参照在医学领域应用成功的数据仓库与数据挖掘相关项目,深入问题领域应用建模方法,针对中医毒热文献特定的复杂的数据格式和数据类型,完成了将中医毒热文献信息转化为关系数据库中的规范化数据,充分利用关系数据库对数据管理的强大功能进行数据清洗和转换。同时,利用开源ETL工具,构建强健、可重用的ETL过程组件,实现了关系数据向多维数据的提取、转换、加载。
     本文还利用数据仓库数据总线技术进行主题划分,完成了各个数据集市的多维数据立方体的构建;通过实现Mondrian和Tomcat的良好集成构建了基于Web的OLAP平台,在此基础上为满足用户需求设计实现了相应的OLAP业务分析功能;同时,将OLAP业务功能模块与Web层其它功能模块相结合实现了一个完整的数据仓库应用原型系统。
     在数据仓库设计开发的各个层次各个阶段充分保证了数据仓库的数据质量,特别是利用RUP开发方法构建中医毒热数据仓库系统,充分利用了其增量迭代开发和风险控制的特点极大改进了数据仓库系统的构建。通过实践证明,本文建立的原型模型是可行的,并且取得较好的效果。
How to use the theory materials of Chinese traditional medicine which accumulated in its long history to assist its development is an urgent issue. Recently, the development of computer science, especially Data warehouse, OLAP and Data Mining, realizes the processes of conversion from information to data and of mining knowledge from data very well. So how to apply these theories and technologies to support and assist the development of Chinese traditional medicine, through the processes containing the converting the materials to the typical data, developing the data cube, taking multi-dimensions、multi-levels analysis and data mining to finish the demonstration of special medicine theory is the urgent issue to be resolved.
     This paper around the design and build of Data warehouse of Virus Medicine system discusses the research about data warehouse hierarchy, the function and normalization of metadata and data model and the research about develop methods mainly contains the realization of RUP and how to assure the quality of data. The applications mainly contain OLAP, Data Ming and OLAM.
     Combine above technologies and the system goals, this paper realizes the assignments as follow: converting information to regular data, develop robust and reusable ETL processes.
     Through data warehouse data bus to determine every topic, design and realize the data cubes. Integrating Mondrian with Tomcat configures the OLAP platform based Web and realizes the OLAP functions to satisfy user’s requirements, assure the data quality of every stages, every levels of data warehouse building. Especially, this paper effectively applies the RUP for the designment of the data warehouse system about virus medicine, so greatly improved the designments and implement of data warehouse system. The prototype models are right verified by practices.
引文
[1] 陈晓银,毛惠君.中医外感风寒、寒湿证病因因素量化和多维相关研究[J].杭州:浙江大学,2007.
    [2] 于彤,陈华钧,吴朝晖.中医临床数据仓库的设计与构建的研究.杭州:浙江大学,2006.
    [3] 王春山,吴朝晖.数据挖掘技术在方剂配伍领域的应用研究.杭州:浙江大学,2006.
    [4] Dong Burdick, Prasad M.Deshpande, T.S.Jayram.OLAP Over Uncertain and Imprecise.Proceedings of the 31st VLDB Conference, Trondheim, Norway, 2005.
    [5] Dong Burdick, Prasad M.Deshpande, T.S.Jayram.Efficient Allocation Algorithms for OLAP over Imprecise Data.VLDB September 12-15, 2006, Seoul, Korea.
    [6] Konstantions Morfonios, Yannis loannidis. CURE for Cubes: Cubing Using a ROLAP Engine.VLDB September 12-15, 2006, Seoul, Korea.
    [7] William H.Inmon著,王志海译. Building the Data Warehouse[M].北京:机械工业出版社,2006:20-23.
    [8] 池太崴.数据仓库结构设计与实施:建造信息系统的金字塔.北京:电子工业出版社,2005.
    [9] 鲍玉斌,于戈. 数据仓库系统中若干关键技术的研究[D]. 沈阳:东北大学,2003.
    [10] Leszek A.Maciaszek,Bruc Lee Liong著. 实用软件工程(英文版). 北京:机械工业出版社,2006
    [11] Scott W. Ambler. 利用基于 RUP 的方法开发数据仓库. http://www.ibm.com/ developerworks/cn/rational/rationaledge/content/dec06/ambler/index.htm.
    [12] Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite著,肖明,王永红等译. 数据仓库生命周期工具箱:设计、开发和部署数据仓库的专家方法. 北京:电子工业出版社,2004.
    [13] 富冬蕾. 基于XML的数据仓库多维模型的研究与应用. 沈阳:中科院沈阳计算所,2007.
    [14] Codd E.F., Codd S.B., Sally C.T.Beyond decision support [J]. USA:Computer World,1993,26:87-89.
    [15] 李盛恩. 多维数据模型和数据立方体技术研究[D]. 北京:中国科学院计 算技术研究所,2003.
    [16] Spago BI. http://www.spagobi.com
    [17] Pentaho. www.pentaho.com
    [18] 林杰斌,刘德明,陈湘编著. 数据挖掘和OLAP理论与实务. 北京:清华大学出版社,2003.
    [19] 谢强.OLAM技术研究及其在电力系统中的应用[D].沈阳:中科院沈阳计算所,2006.
    [20] 梁爱虎. 精通SOA:基于服务总线的Struts+EJB+Web Service整合应用. 北京:电子工业出版社,2007.
    [21] 梁立新. 项目实践精解:基于Strut-Spring-Hibernate的Java应用开发. 北京:电子工业出版社,2006.
    [22] Jens-Peter Dittrich, Donald Kossmann, Alexander Kreutz.Bridging the Gap between OLAP and SQL.Proceedings of the 31st VLDB Conference, Trondheim, Norway, 2005.
    [23] Xiaolei li, Jiawei Han, Hector Gonzalez.High-Dimensional OLAP: A Minimal Cubing Approach.VLDB 2004, Toronto Canada:528-539.
    [24] XML DB How To Documents. http://www.Oracl e.com/technology/sample_code/ tech/java/codesnippet/xmldb/index.html.
    [25] 胡锡伟,陈仲委. Oracle数据库的XML存储技术研究. 计算机工程与设计,2005(5):1179-1181.
    [26] 刘汝焯等. 审计数据的多维分析技术. 北京:清华大学出版社, 2006.
NGLC 2004-2010.National Geological Library of China All Rights Reserved.
Add:29 Xueyuan Rd,Haidian District,Beijing,PRC. Mail Add: 8324 mailbox 100083
For exchange or info please contact us via email.