计算机试验简介

COSeditor

https://cos.name/2011/11/introduction-ofcomputer-experiment/

Ihavenothing

大刀威武，好好拜读一下。

yihui

谢谢，我过去以为郝大刀是个真名……

看这意思是数据的生成过程我们是知道的？按某种数据生成机制生成一些随机数然后去优化某些参数？

bigknife

[未知用户] 我觉得可以按照你所说的这么理解。事实上，计算机试验最常用于对于一些有限元方法得到的模型的再次模拟。是某种复杂模型的模型，是二次逼近。用统计模型来模拟某个复杂的模型。因为在实际中，这些复杂的模型可能非常之复杂，如要改进具体参数，可能无从下手。做几次试验，用一个简单的拟模型来逼近它，则可以方便做一些优化吧。
ps：之前我也一直迷糊，既然有了模型，干吗还要用拟模型来模拟这个模型。不过计算机试验在实际中，比如工业界，航天业之类的应用的确实很广泛。应该是很有用的吧。

bigknife

[未知用户] 谢谢哈，你太捧了，我这写的真得很一般哈，感觉还有好多东西没写出来。以后慢慢继续写吧哈。

yihui

[未知用户] 是的是的，我和你有一样的迷糊，哈哈

mingsnu

多谢分享，能有个实例就更好了，理解起来可能轻松点……

dingpeng

invited comments:

庹睿 12:44:23
如果一定要我点评，我就说一句话：对于计算机实验，数据分析比实验设计更加重要。

bigknife

[未知用户] 我同意庹睿的观点，试验设计的功能是使得数据分析的结果更加精确。也很重要哈。

bigknife

[未知用户] 过两天我补充一个例子哈

siemenxu

我现在正在做计算机实验数据分析方法的研究，很高兴看到有人贴相关的文章，虽然我对实验设计这块基本不懂。这个非随机性在计算实验设计中是怎么体现的呢？和传统实验设计又有多大不同呢？

bigknife

[未知用户] 传统实体试验，比如说在试验室做化学或者物理试验，你两次试验放进去的配料或者什么其他因素水平都是一样的，但是结果一般来说都是不同的。因为有随机误差的影响。而计算机试验，只要你试验因素水平组合一样，那么输出的结果肯定是一样的。因此，在计算机试验的时候不需要重复。

siemenxu

[未知用户] 嗯。才发现你是南开的，还是刘老师的学生？我是02统计（本科）的。
因为这种不可（必）重复性，会导致很多优化准则什么的不能实现吗？或者要发展一些新的准则之类的吗？拉丁超立方体设计专门为计算机实验的还是一般的实验也适用呢？

bigknife

[未知用户] 原来是师兄。我是刘老师的学生哈。拉丁超立方体设计最早提出并非是为了计算机试验的设计，但是在计算机试验的设计中用的最多。之前有看到一个文章，利用了近似正交拉丁超立方体做变量选择，比如说lasso，做模拟的时候发现正交拉丁超立方体设计的对于变量选择的错选率明显比简单随机抽样小了很多。这种设计对于一般的试验也是适用的。关于优化准则这个，我不是很理解您的问题哈。不过我觉得，肯定是不会导致的。

白玉龙吟

请问现在计算试验设计和分析这块，有没有一些现成的工具可以用啊？还是说必须要自己编程序？我看上面提到的几个包都是R语言的啊！

xingzhaoh

前两天一直在看你在第5届R会议关于机器学习的实验设计初探，PPT中的R代码不全，不知你可以把代码发到我邮箱吗？

bigknife

[未知用户] 这两天太忙了，过两天打包给你。