DOE就在你身边DOE系列之一
DOE,即试验设计(DesignOfExperiment),是研究和处理多因子与响应变量关系的一种科学方法。它通过合理地挑选试验条件,安排试验,并通过对试验数据的分析,从而找出总体最优的改进方案。从上个世纪20年代费雪(RonaldFisher)在农业试验中首次提出DOE的概念,到六西格玛管理在世界范围内的蓬勃发展,DOE已经历了80多年的发展历程,在学术界和企业界均获得了崇高的声誉。
然而,由于专业统计分析的复杂性和各行各业的差异性,DOE在很多人眼中逐渐演变为可望而不可及的空中楼阁。其实,DOE绝不是少数统计学家的专属工具,它很容易成为各类工程技术人员的好朋友、好帮手。本文将以一个日常生活中的小案例为线索,结合操作便捷的专业统计分析软件JMP,帮助大家揭开DOE的神秘面纱,了解DOE的执行过程,自由自在地建立属于自我的DOE空间。
场景:相信大家都吃过爆米花,但是大家是否都了解爆米花的制作过程?在品尝爆米花的时候,不知道您是否注意到有很多爆米花没有爆开,也有很多被爆焦。这两种情况都是生产过程中的质量缺陷。
这里,我们基于六西格玛软件JMP来实现我们的目标:寻找使用微波炉加工一包爆玉米花的更佳程序。凭借经验,我们很容易就能确定重要因子的合理范围:加工爆玉米花的时间(介于3至5分钟之间)
微波炉使用的火力(介于5至10档之间)使用的玉米品牌(A或B)
在爆玉米花时,我们希望所有(或几乎所有)的玉米粒都爆开了,没有(或很少)玉米粒未爆开。因此玉米的\爆开个数\是最终关注的重点。
第1步:定义响应和因子(如图一所示)
图一定义响应和因子
第2步:定义因子约束(如图二所示)
根据经验,你知道:不能在试验中长时间高火力加工爆玉米花,因为这样会烧焦某些玉米粒。不能在试验中短时间低火力加工爆玉米花,因为这样只有少数玉米粒爆开。所以要限制试验,以使加工时间加上微波炉火力小于等于13,但大于等于10。
图二定义因子约束
第3步:添加交互作用项(如图三所示)
我们可以推测:与爆开玉米比例相关的任意因子效应可能取决于某些其它因子的值。例如,品牌A时间变化的效应可能大于或小于使用品牌B相同时间变化的效应。这种因子表现出的协同效应统称为二因子交互作用。我们决定在爆玉米花加工过程的先验模型中纳入所有可能的二因子交互作用。
图三添加交互作用项
第4步:确定试验次数(如图四所示)
根据在模型中添加的效应,执行试验需要一定的试验次数。我们可以使用最小值、建议值,也可以指定试验次数,只要其值大于最小值。本例中,我们将使用默认的试验次数16。
图四确定试验次数
第5步:指定输出表格(如图五所示)
生成的数据表保留了随机化的特性,显示了我们应该运行试验的顺序,首先在7级火力下将第一包B牌的玉米加工3分钟,然后在5级火力下将B牌玉米加工5分钟,依次进行。
图五指定输出表格
第6步:收集和输入数据(如图六所示)
根据设计方案加工爆玉米花。然后,计算每包中爆开的玉米粒的数量。最后,保存结果至数据表。
图六收集和输入数据
第7步:分析结果(如图七所示)
可以构建数据模型了,一般使用最常见的分析方法--最小二乘法,但是如果响应数据明显不呈正态分布时,选择广义线形模型法会显得更为合适。
图七分析结果
简要地查看输出报告中的\参数估计\表,发现所有的p值都小于0.05,表明所有的模型效应,包括一次主因子作用、二次主因子作用和双因子交互作用,均是显着的。
我们已确认时间、火力以及品牌与爆开玉米粒个数之间存在着紧密关系,要进行进一步研究,可以打开\预测刻画器\,分析因子组合的变化如何影响爆开玉米粒的个数。预测刻画器显示了每个因子对响应的预测轨迹,移动红色虚线,便能查看更改因子值对响应产生的影响。例如,单击\时间\图中的红线并左右拖动,当\时间\值从3转移至5时,\爆开个数\也在发生相应得变化。同时,随着时间的增加和减少,时间和火力预测轨迹的斜率也随之改变,表明确实存在时间和火力的交互效应。
最后,还可以通过\预测刻画器\寻找出最优设置,即最合意的设置。我们根据试验分析结果而推荐的方法是:使用A品牌,加工5分钟,并将火力调为6.96级。试验预测在此种设置下加工,产出的玉米粒445个以上都爆开了。
类似这种爆玉米花的案例在我们的生活和工作中还有很多很多,有兴趣的读者完全可以将平时遇到的问题抽象成一个DOE模型,然后借助JMP这样的专业统计分析软件,轻轻松松地得到问题的解决方案。有关DOE的更加深入的理论和应用,笔者会在今后的文章中继续与大家交流。
初识DOE-DOE系列之二
其实,DOE对中国人来说,也不是一个完全崭新的内容。早在新中国成立初期,华罗庚教授就在我国农业、工业领域大力倡导与普及DOE,只是当时他运用的是另一个名词——优选法。七十年代末,方开泰教授和王元院士又提出了著名的“均匀设计”法,这一方法在我国航空航天事业中的导弹设计中取得了巨大成效。与此同时,“均匀设计”法也在全球研究DOE理论的学术界得到了高度赞誉。但是,在将DOE的先进理念和科技方法向各行各业转移,向一般技术人员转移,并转换为高效生产力的道路上,我们的进展还很有限。
通过“DOE系列之一”我们已经知道:DOE与人们的生活及工作密切相关,在专业六西格玛统计分析软件JMP的帮助下,掌握DOE也不再是一件难事。从本质上讲,DOE是这样一门科学:研究如何以最有效的方式安排试验,通过对试验结果的分析以获取最大信息。所以,DOE有两大技术支柱:试验规划和分析方法。其中,试验规划又可以分为均分设计、因子设计、响应面设计等,分析方法又可以分为极差分析、方差分析、多元回归分析等。虽然DOE的理论体系中涉及统计分析的专业词汇很多,但为便于读者理解,本文包括后续的系列文章将尽量避免过多地涉及统计分析的基本概念,而是将以“解决问题的思路”为导向,由浅入深地向读者介绍DOE的理论体系和应用过程。另外,感谢当代高速发展的计算机技术,我们可以借助六西格玛统计分析软件JMP来实现上述所有的试验设计方案,顺便提一下,JMP是目前唯一能实现上述所有试验设计方案的六西格玛统计分析软件,而且已经面向大中华地区推出中英文双语版软件。
一般的实际问题都是纷繁复杂、千变万化的,但是透过现象看本质,所有实际问题的共同点也可以通过统一的模型来抽象概括。图一就是一个高度简化的过程模型,其中Y1,Y2,…,Ys是我们关心的输出变量,例如质量指标、生产能力和成本等,通常被称为“响应变量”(Response);X1,X2,…Xk是我们在工作中可以加以控制的输入变量,例如人员、设备、原材料、操作方法和环境等,通常被称为“可控因子”(Factor),它们可以是连续型数据,也可以是离散型数据;中间的“黑匣子”是“过程”(Process),在前两者之间起着衔接转换的作用,它与不同行业、不同产品、不同技术密切相关,但整体都可以用的数学模型来表示。这个数学模型的具体表达式越精准,说明我们对这个过程的理解越深刻,DOE就是协助我们揭示或验证数学模型表达式的利器!
图一过程模型
在某些要求不高的工作环境中,往往不需要用一个复杂的数学表达式来描述过程
的全貌,但至少要了解哪个或哪几个因子(X)对响应(Y)的影响显著,哪些因子之间存在着相互影响的关系等。这时,“主因子作用”(MainEffect)和“交互作用”(Interaction)可以帮助我们回答这些问题。在此,不强调具体的计算过程,主要以视觉效果阐述主要概念。主因子作用是指一个因子在不同水平下的变化导致响应的平均变化量。正如图二所示,X在-1和+1两个水平下Y值的落差反映的就是主因子作用。交互作用是指当其他因子的水平改变时,一个因子的主因子作用的平均变化量。正如图三所示,左半部分的因子A对Y的影响没有受因子B的变化而变化,两组A与Y的回归直线完全平行,表明因子A与B之间没有任何交互作用;反之,右半部分的因子A对Y的影响受因子B的变化而变化,两组A与Y的回归直线明显相交,表明因子A与B之间存在显著的交互作用。
图二主因子作用示意图
图三交互作用示意图