编辑: qksr | 2019-07-15 |
关键词:均匀设计,拉丁超立体抽样,因子设计,正交性,均匀性.
1 历史回顾 廿世纪七十年代,在系统工程、高科技发展的推动下,计算机仿真 (仿真) 试验(computer experiments) 的需求十分强烈,迫切要求高质量的试验设计.于是 计算机仿真试验设计 (Design of computer experiments) 在那时成为一个最有挑战 的课题.在北美洲,三位学者 (McKay, M.D., Beckman, R.J. and Conover, W.J. (1979))在 Technometrics 提出了 拉丁超立方体抽样 (Latin Hypercube Sampling) (简称 LHS) 的方法,并立即得到广泛的应用,一批学者对其理论和方法作了系统 地研究和发展,形成了一个独立的分枝.差不多在同一时间,在中国,我和王元 院士提出了 均匀设计 (Uniform Design) (简称 UD) .文章最初在
1978 年发表在 中国科学院数学研究所的内部通讯,后来中、英文稿分别发表在《应用数学学报》 和《科学通报》 .那时,中国正处于文化大革命刚结束,百废待兴的时代,学术上 与世界几乎隔绝.有趣的是,LHS 和UD 有异曲同工之处.表现于: (A)两种方法均将试验点均匀地散布于输入参数空间, 故在文献中广泛使用术语 充满空间的设计 (space filling design) LHS 给出的试验点带有随机性,故称为抽 样;
而UD 是通过均匀设计表来安排试验,不带有随机性. (B) 两种方法的最初理论均来自 总均值模型 (Overall Mean Model) LHS 希望试 验点对输出变量的总均值提供一个无偏估值,且方差较小,而UD 是希望试验点 能给出输出变量总均值离实际总均值的偏差最小. (C) 两种设计均基于 U-型设计. (D)两种设计能应用于多种多样的模型,且对模型的变化有稳健性. 经过了廿多年的发展,两种不同思路的方法是分道扬镳,还是相互补充,相 互融合呢?本文想作一些回顾和讨论.为此,我们需要介绍两种方法的思路、模型、方法和应用.
11 2 总均值模型 设输入变量 与输出变量有一个确定性的关系 s x x , ,L
1 , , x , , ,
1 1 s s s C x x x x f y ∈ = = L L (2.1) 这里假定试验区域为单位立方体 ,变量 y 在C 上的总均值为 [ ]s s C
1 0, = s ( ) ( ) ∫ = s C s s dx dx x x f y E , , , , L L
1 1 (2.2) 若在C 上取了 n 个试验点, ,y 在这 n 个试验点上的均值为 s n x , , x L
1 ( ) ( ),
1 1 ∑ = = n i i n f n D y x (2.3) 此处 代表这 n 个点的一个设计. { n n D x , , x L
1 = } LSH 方法是用抽样的方法来选取 使相应的估计 n D ( n D y )是无偏的,即()()(,yEDyEn=)且方差 ( ) ( n D y , x L
1 ) Var 尽可能地小.McKay, Beckman and Conover (1979) 指出 LSH 比简单随机抽样要好,即前者所获得的总均值比后者有较小的方差.若设计点集 中的点 独立同分布, 遵从C 上的均匀分布, 相应样本均值 random D n x , s ( ) random D y 是 的无偏估计,其方差为 (y E ) ( ) ( ) n f x Var ,其中 x 在 上均匀分布.如果试验点 同分布,但相互之间有相关性,得sC()() ( ) , Cov
1 Var Var
2 1 n f f n n f DLHS x , x x ? + = (2.4) 右边第一项是随机抽样时样本均值的方差,故()()()nfDLHS x Var Var <