正交实验如何数据分析
我们把在试验中考察得有关影响试验指标得条件称为因素(也叫因子),把在试验中准备考察得各种因索得不同状态(或配方)称为水平.在研究比较复杂得工程问题中,往往都包含着多个因素,而且每个因素要取多个水平。
对于包含五个因素、五个水平得工程项目,理论计算必须进行55=3125次试验.显然,所需要得试验次数太多了,工作量太大。实践告诉我们,合理安排试验与科学分析试验,就是试验工作成败得关键。
试验方案设计得好,试验次数就少,周期也短,这样不仅节省了大量人力、物力、财力与时间,而且可以得到理想得结果。相反,如果试验设计安排得不好,即使进行了很多次试验,浪费了大量材料、人力与时间,也不一定能够得到预期得结果.
正交试验法,就就是在多因素优化试验中,利用数理统计学与正交性原理,从大量得试验点中挑选有代表性与典型性得试验点,应用“正交表”科学合理地安排试验,从而用尽量少得试验得到最优得试验结果得一种试验设计方法。
正交试验法也叫正交试验设计法,它就是用“正交表\来安排与分析多因素问题试验得一种数理统计方法。这种方法得优点就是试验次数少,效果好,方法筒单,使用方便,效率高。
由于试验次数大大减少,使得试验数据处理非常重要。我们可以从所有得试验数据中找到最优得一个数据,当然,这个数据肯定不就是最佳匹配数据,但就是肯定就是最接近最佳得了。
用正交表安排得试验具有均衡分散与整齐可比得特点。均衡分散,就是指用正交表挑选出来得各因素与各水平组合在全部水平组合中得分布就是均衡得。整齐可比就是说每一因素得各水平间具有可比性。
最简单得正交表L4(23)如表-1所示。 表-1 1 2 3 水 列 平 实 验 号 号 1 2 3 4 1 1 2 2 1 2 1 2 1 2 2 1 记号L4(23)得含意如下:
“L”代表正交表;
L下角得数字“4"表示有4横行(简称为行),即要做四次试验;
括号内得指数“3”表示有3纵列(简称为列),即最多允许安排得因素个数就是3个; 括号内得数“2\表示表得主要部分只有2种数字,即因素有两种水平l与2,称之为l水平与2水平。
表L4(23)之所以称为正交表就是因为它有两个特点:
1、每一列中,每一因素得每个水平,在试验总次数中出现得次数相等.表-1里不同得水平只有两个——1与2,它们在每一列中各出现2次。
2、任意两个因素列之间,各种水平搭配出现得有序数列(即左边得数放在前,右边得数放在后,按这一次序排出得数对)时,每种数对出现得次数相等。
这里有序数对共有四种(1, 1),(1,2),(2,1),(2,2)。它们各出现一次。
3713
常见得正交表有:L4(2),L8(2),L16(25),L32 (21) ,…;L9 (34),L27 (313)。。.;L16(45),…;L25(56)……等。
此外还有混合水平正交表:各列中出现得最大数字不完全相同得正交表称为混合水平正
14
交表。如L8(4×2),表中有一列最大数字为4,有4列最大数字为2。也就就是说该表可以安排1个4水平因素与4个2水平因素。
选择正交表得原则,应当就是被选用得正交表得因素数与水平数等于或大于要进行试验考察得因素数与水平数,并且使试验次数最少。如我们要进行3因素2水平得试验,选用 L4(23)表最理想.但就是,要进行5因素2水平得试验仍用L4(23)表,那么便放不下5个因素了。这时,应当选用L8(27)表,这样尽管只用了此表得5个因素列,还有两个因素列就是空列,但这并不影响分析。
对试验结果(数据)得处理分析通常有两种方法,一就是直观分析法,又叫极值分析法;另一种方法就是方差分析。
表-2 1. 直观分析法:
水 因 根据正交表进行试验,可以得到就某 素 平 试 一(单指标,也有多指标)考察指标得试验验 结果,通过直观分析或方差分析,就可以得1 出最佳得实验方案。 2 直观分析试验结果得步骤(以四因素3 三水平为例)如下,见表-2,根据实验数据
4 分别计算出:
5 ① 分别对每次实验各因素得一水
6 平得实验结果求与,即Ij:
7 再对每次实验各因素得二水平结果
8 求
与,即IIj: 9 对每次试验各因子得三水平得结果求 Ij 与,即IIIj: Ⅱj ② 分别求出各因素各水平结果得IIIj 平均值:即Ij/3,IIj/3,IIIj/3,并填
Ij/3 入正交表中;
IIj/3 ③ 分别求出各因素得平均值得差值
IIIj/3 (也叫极差),如果就是三个以上水平则要
找出平均值最大值或最小值之间得差值RRj R1 R2 R3 R4 j.
根据极差数Rj得大小,可以判断各因素对实验结果得影响大小。
判断原则就是:极差愈大,所对应得因素愈重要;由此可以确定出主、次要因素得排列顺序.
根据各因素各水平所对应指标结果得平均值得大小可以确定各因素取什么水平好。 确定得原则就是:如果要求指标愈小愈好,则取最小得平均值所对应得那个水平;如果要求指标愈大愈好,则取最大得平均值所对应得那个水平;如果要求指标适中(固定值),则取适中得平均值所对应得那个水平。
A B C D 结果 (指标) 需要说明得就是,最优得水平组合并不一定就在由正交实验设计所指定得实验当中。 所以,根据试验指标得数值要求所确定得各因素得最优水平组合,就可以筛选出最佳得试验方案条件、以及较好得试验方案条件。
对试验结果得直观分析法,除了极差分析外。为了更形象直观得得出试验分析结果,我们还可以采用画趋势图(效应曲线图)得方法,得出正确得综合分析结论.
效应曲线图(因素指标分析)就就是要画出各因素水平与指标得关系图,它就是一种座标图,它得横座标用各因素得不同水平表示;纵座标同为试验指标。其实它就就是根据极差分析数据所绘出来得,可以一目了然瞧出各因素得哪个水平为最优(根据指标得具体数值要求).
2.方差分析法:
通过试验可以获得一组结果实验数据,这组数据之间一般会存在一定得差异,即使在相同得条件下做几次试验,由于偶然因素得影响,所得得数据数据也不完全相等,这说明实验数据得波动不仅与实验条件得改变有关,也包括实验误差得影响.
方差分析就是用来区分所考察因子得由于水平不同对应得试验结果得差异就是由于水平得改变所引起还就是由于试验误差所引起得,以便进一步(在直观分析得基础上)检验哪些因子对结果有影响,哪些没有影响,并区分哪些就是影响结果得主要因素,哪些就是次要因素。
我们通过一个例子来说明方差分析法得原理与计算方法。
在研究某胶料得过程中,为考察生胶得转动黏度对胶料压缩变形有无显著得影响,进行了试验,其实验结果如表-3所示:
表-3
压 缩 变 试 验 形 号 度 黏 139 142 147 150 1 2 3 平均值 38、2 33、3 36、0 35、8 36、5 35、9 32、8 35、1 35、6 34、1 32、8 34、2 32、2 31、6 35、6 33、2 我们把转动黏度记做因子A,这就是单因子4水平得实验,每个水平都进行了3次重复试验,从这组试验数据,如何来判断A因子对压缩变形有无显著性影响呢?
首先从这组数据出发,计算出实验误差引起得数据波动及A因子水平得改变所引起得数据波动。
可以观察到在A得同一水平下,虽然试验条件没有改变,但所得得试验数据不完全一样,也就就是说压缩变形值不完全一样。这就是由于试验误差得存在使数据发生了波动。例如,A得第一水平下(A1=139)数据得平均数为:
=(38、2+33、3+36、0)=35、8
数据得波动值就是:
222
S1=(38、2—35、8)+(33、3—35、8)+(36、0—35、8)=12、0
5
我们称S1为A得第一水平下得偏差平方与。偏差平方与反映了一组实验数据得分散与集中得程度,S大表明这组数据分散,S小表明它们集中。
类似地,可以按公式:
SA=,i=1,2,3,4