多因素试验优化算法及医学应用
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
多因素、多水平试验设计和优化的目的是研究如何在实验区域内最有效地选择试验点,以最少的试验次数研究各因素的作用和因素间的交互作用,并确定影响试验结果的最优条件。本文利用木豆叶中总黄酮提取量的最大优化问题与胃蛋白酶中残留蛋白含量控制的最小优化问题中的正交试验结果,突破传统的方差分析模型,将回归分析方法应用于其结果分析,拟合二次响应面回归模型,两模型均有统计学意义,拟合效果较好,在总黄酮提取量最大的优化问题中,R~2达到99.91%,一次项、二次项有统计学意义,其决定系数分别为55.34%、44.56%;在残留蛋白含量最小的优化问题中,R~2达到98.61%,一次项、二次项有统计学意义,其决定系数分别为65.94%、32.67%;在两实例中,因素间均无交互作用,不存在模型的拟合不足,残差围绕零随机分布,cook's距离均在±2之间,所以两实例的试验数据拟合二次响应面回归模型的效果好。在二次响应面回归模型的基础上,分别利用最速上升法、遗传算法搜索最优试验条件,并与正交试验设计的直接寻优法进行比较。最速上升法沿着曲面最大增量的方向逐步移动,直到观察到的响应不再增加为止的寻优方法,最速上升法能保证局部收敛性,因而易陷入局部最优。遗传算法(genetic algorithm,GA)是一种模拟自然进化过程的随机搜索方法,能保证全局最优。对于木豆叶中总黄酮提取的最大优化问题,最速上升法所确定的最优试验条件为:加水量为木豆叶重量的10.2倍、煎煮温度93℃、煎煮3次、每次1.5小时,此时总黄酮提取量将达到0.896029mg/g。利用遗传算法,在种群规模为30,染色体串用二进制表示的总长度为80位,采用单点交叉的方式,交叉概率P_c=0.80,变异概率P_m=0.05,最大进化世代数为100,所确定
    
    山西医科大学硕士学位论文2003
    的最优试验条件为:加水量为木豆叶重量的10.5倍、温度99.70c、煎煮3
    次、每次1.5小时,总黄酮的提取量为1.0713mg/g。与最速上升法相比,
    总黄酮的提取量增加了0.1753m留g,提高了20%。若将煎煮时间的搜索范
    围扩大为0.75一2.0小时,算法参数不变,遗传算法确定的最优试验条件
    为:加水量10.5倍,煎煮温度99.4OC,煎煮3次,每次煎煮2小时,总黄酮
    提取量达到1.8499m岁g,比在试验范围内的条件下增加了0.7786m创g,提
    取量提高了72.68%。从分析结果看,在优化试验条件时遗传算法比最速
    上升法更具优势。对于胃蛋白酶中残留蛋白含量控制的最小优化问题,最
    速上升法所确定的最佳工艺条件为:水解温度为45.40C、水解3.95小时,
    加3.0%的盐酸、烘房温度61.50c,此时残留蛋白含量约降到0.007569mol。
    利用遗传算法,在种群的规模为40,包含四个影响因素的每个染色体串
    用二进制表示的总长度为80位,采用单点交又的方式,交叉概率尸c=0.85,
    变异概率尸m=0.05,最大进化世代数为100,所确定的最佳工艺条件为:
    水解温度为46.7oe、水解3.75小时、加3.oo’o的HeL、烘房温度64.1“e,
    此时胃蛋白酶中残留蛋白的含量约降到0.OO01mol。较最速上升法减少了
    0.OO75mol,降低了98.68%。而正交试验设计寻优的直接法只能在试验设
    计的各因素水平上确定最优试验条件,不能预测残留蛋白的含量。
The purpose for multiple levels of multiple factors experiment and optimization is to test the significance of individual factor and to search the best experimental condition for the response variable. The study introduces the method of regression analysis to the analysis of data of orthogonal experiment about withdrawing total flavone from wood bean leaves and measuring residual protein in the production of pepsin by fitting quadratic response surface regression model. The results showed that two the quadratic response surface regression models were significant in the significance of linear term and quadratic term but no significance of cross product term. The fitting effect of the models was good.
    The best experimental condition was searched by the steepest ascending method and genetic algorithm (GA). The steepest ascending method finds the best local point by climbing the steepest permissible gradient around search space until the gradient of object function equal to zero. A genetic algorithm emulates biological evolutionary theories to solve optimization problems. According to evolutionary theories, only the most suited strings in the population are likely to survive and generate their offspring, thus transmitting their biological heredity to new generations.
    The best local point of withdrawing total flavone from wood bean leaves was that with 10.2 times of water, 3 times of decoction of 1.5 hours each, in the water temperatured 93 , the withdrawing measure of total flavone reached 0.896029mg/g, according to the steepest ascending method. According to GA, under the following condition when population size=30,
    
    
    chromosome length=80, crossover probability=0.80, mutation probability=0.05, max generation=100, an excellent design strategy was that with 10.5 times of water, 3 times of decoction of 1.5 hours each, in the water temperatured 99.7 , the withdrawing measure of total flavone reached 1.0713mg/g. The result showed GA was more excellent than the steepest ascending method. The total flavone was increased 0.1753mg/g, that was it was increased 20%. If extending the searching scope of decoction time from 0.75 to 2.0 hours, the best experimental condition was that with 10.5 times of water, 3 times of decoction of 1.5 hours each, in the water temperatured 99.4 , the withdrawing measure of total flavone attained to 1.8499 mg/g, which was increased 0.7786 mg/g, increaseing 72.68% than the former by GA. The best local point of measuring residual protein in the production of pepsin was that with 45.4 of the hydrolysis temperature, 3.95 hours of the hydrolysis time 3.0%HCL and 61.5 of the bake-house's temperature, the me
    asure of residual protein in the production of pepsin reduced to 0.007569mol, according to the steepest ascending method. According to GA, under the following condition when population size=40, chromosome length=80, crossover probability=0.85, mutation probability=0.05, max generation=100, an excellent design strategy was that with 46.7 of the hydrolysis temperature, 3.75 hours of the hydrolysis time 3.0%HCL and 64.1 C of the bake-house's temperature, the measure of residual protein in the production of pepsin reduced to 0.0001mol. The result showed GA was more excellent than the steepest ascending method. The measure of residual protein was decreased 0.0075mol, that was it was decreased 98.68%, than the former by GA.
引文
1.邵学广,等.化学信息学.北京:科学出版社,2001
    2.袁亚湘,等.最优化理论与方法.北京:科学出版社,2001
    3.邓乃扬,等.无约束最优化计算方法.北京:科学出版社,1982
    4.Douglas C. Montgomery.实验设计与分析(第三版).北京:中国统计出版社,1998
    5.D.J.华尔德等.优化法基础.北京:科学出版社,1978
    6.方开泰,等.正交与均匀试验设计.北京:科学出版社,2001年
    7.方开泰,等.正交设计的最新发展和应用(Ⅰ)—同归分析在正交设计的应用.数理统计与管理,1999,18(2)44~49
    8.方开泰,等.正交设计的最新发腱和应用(Ⅱ)—均匀正交设计.数理统计与管理,1999,18(3)43~52
    9.方开泰,等.正交设计的最新发展和应用(Ⅲ)—正交设计的D-最优性.数理统计与管理,1999,18(4)43~52
    10.方开泰,等.正交设计的最新发展和应用(Ⅳ)—正交设计的投影性质.数理统计与管理,1999,18(3)35~43
    11.仇丽霞,等.二次响应面回归模型在优选制药工艺条件中的应用.中国卫生统计学杂志 1999,16(1)52~53
    12.仇丽霞,等.二次响应面回归模型在胃蛋白酶质量控制中的应用.山西医学院学报,1995,26(3)208~210
    13.北京大学概率统计系,主编.SAS系统使用手册,北京:北京大学新技术公司,1993:8
    14.赵正佳,等.广义Gauss模型及其模拟退火算法.中国WEB信息博物馆 2002,7,26
    15.化学计量学研究方法.中国WEB信息博物馆 2002,7,26
    16.张承恩.混料设计与参数优化应用技巧.中国WEB信息博物馆 2002,7.26
    17.Douglas M. Bates著.韦博成,等译.非线性回归分析及其应用.北京:中国统计出版社.1997
    18.张敏,等.利用回归设计模型寻求橡胶配方优化方案.应用概率统计,1988,4(4)430~433
    
    
    19.倪永兴.多指标试验公式评分法和综合比较法探讨.应用概率统计,1988,4(1)85~88
    20.许守群.R—PVC挤出粒料优化设计——介绍多指标试验设计一种方法.数理统计与管理,1990,(6)30~35
    21.杨兆军,等.二次回归正交组合设计在消除试验机摩擦振动中的应用.数理统计与管理,1990,(4)18~20
    22.霍显刚,等.正交设计与回归分析在水泥快速测定中的应用.数理统计与管理,1990,(4)1~3
    23.周赛花.多指标选优的极差分调法.数理统计与管理,1990,(3)29~33
    24.万存绪,等.多元二次回归设计在山药栽培中的应用.数理统计与管理,1990,(2)13~193
    25.胡育筑,主编.化学计量学简明教程.北京:中国医药科技出版社,1997
    26.刘大秀,等.投影追踪回归在试验设计分析中的应用研究.数理统计与管理,1995,(1)47~51
    27.盛海林,等.多指标正交试验的分析.数理医药学杂志,2000,13(5)395~396
    28.张建方.一种多指标优化设计方法.数理统计与管理,1988,(2)36~39
    29.姜汉桥,等.用回归正交设计建立油田堵水增产模型.数理统计与管理,1991,(6)10~13
    30.张里千.交互作用和多因素最优化—澄清一个历史性误会.数理统计与管理,1991,(3)28~35
    31.宋华斌,等.论正交法与三次设计中的综合评分.数理统计与管理,1994,13(4)36~40
    32.盛子宁,等.几个正交列表的交互作用.应用概率统计,1994,10(1)5~9
    33.周赛花,等.窄带有源滤波器的正交优化设计.应用概率统计,1989,5(3)283~288
    34.张润楚,等.均匀设计抽样及其优良性质.应用概率统计,1996,12(4)337~345
    35. Zhang SanGuo. Strong Consistency of Parameters in the Quadratic Errors-in-Varibales Model with Replicated Observations. 应用概率统计, 2002, 18 (1) 87~93
    36.刘建南,等.采用正交试验法优化金刚石工具的生产工艺.数理统计与管理,1988,(3)1~4
    37.张里千,等.多因素最优化的重大突破—简记正交表方法的发展史(下半篇).数理统计与管理,1998,17(2)46~51
    38.Z.米凯利维茨.演化程序——遗传算法和数据编码的结合 北京:科学出版社,2000
    39.张学中.计算机直接试验设计.数理统计与管理,1995,(4)43~46
    
    
    40.敬莆松.多元多项式回归在农业研究中的应用.数理统计与管理,1987,(1)6~10
    41.羊亚平,等.煮茧最优工艺条件的研究.数理统计与管理,1987,(6)1~4
    42.徐政权,等.多指标正交设计法,调试三角带底胶配方.降低三角带成本.数理统计与管理,1989,(4)25~27
    43.董占山,等.回归设计试验指导与统计通用软件包.中国WEB信息博物馆 2002,7.26
    44.饶建锡.均匀设计应用中的若干值得注意的问题.中国WEB信息博物馆 2002,7.26
    45.科教兴国振兴中华—方开泰、王元首创均匀设计法.中国WEB信息博物馆 2002,7.26
    46.配方混料设计方法简介.中国WEB信息博物馆 2002,7.26
    47.郝行舟,等.正交试验设计方法在试验设计中的应用.中国WEB信息博物馆 2002,7.26
    48.李敏强,等.遗传算法的基本理论与应用.北京:科学出版社,2002
    49.刘勇,等.非数值并行算法——遗传算法.北京:科学出版社,1995
    50.王小平,等.遗传算法——理论、应用.西安:西安交通大学出版社,2002
    51.刘中秋,等.生脉成骨片中木豆叶提取工艺研究.中成药 1998;20(3):7~9
    52.金丕焕,主编.医学统计学方法.上海:上海医科大学出版社,1993:90
    53. Jose L. R.iberiro Filho and Philip G. Treleaven, Genetic-Algorithm Programming Enviroments, Computer; June., 1994.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700