正交试验设计应用要点及其DPS实施
来源:用户上传
作者: 郭新梅
摘要 正交试验设计是进行多因素试验最简单、精确的方法,系统阐述了正交试验应用的重要知识点,包括指标、因素、水平的选择,因素间互作列及空列的合理设置,并详细介绍了如何利用DPS软件进行正交试验设计与数据分析,以期促进正交试验设计的合理使用。
关键词 正交试验设计;正交表;因素;交互;空列;DPS
中图分类号 S11+4;O212.6 文献标识码 A 文章编号 1007-5739(2012)03-0040-02
Key Points on Orthogonal Test Design and Application of DPS
GUO Xin-mei
(College of Agriculture and Plant Protection,Qingdao Agricultural University,Qingdao Shandong 266109)
Abstract Orthogonal test design was the simplest and accuratest method of multiple-factor experiment.The key point of orthogonal test design were expatiated systematically,including how to select experimental indicator,factors and levels,and how to handle interaction effect and vacant column.The process of orthogonal experimental design and data analysis by applying DPS were introduced in detail,so as to help users use orthogonal design fleetly and exactly.
Key words orthogonal test design;orthogonal table;factors;interaction;vacant column;DPS
统计学课程中的正交试验设计对于本科生、硕士生甚至博士研究生进行正确、合理、科学的论文设计、撰写以及今后进行科学研究非常重要,然而由于高校统计类课程学时减少,正交试验设计的讲授和学习被压缩甚至删除,很多科研工作者尤其是研究生在做科学研究时不能正确地进行试验设计和统计分析。通过调研发现,正交试验设计的应用现状令人堪忧,如出现不设置空白列,又不做重复试验等问题[1]。
正交试验设计也称正交设计(orthogonal design),是利用一套规格化的正交表(orthogonal table)安排试验,得到的试验结果再用数理统计软件进行数据处理。在正交表上安排试验可以使处理具有均匀分散性,以进行综合分析比较,达到以较少的试验次数得到最佳结果的目的[1]。 正交表不仅能大大减少全面试验试验次数,而且还能通过试验分析把好的试验点(即使不包含在正交表中)找出来。此外,虽然利用传统的单因素试验法可能与正交设计试验得出的结果一致,但正交试验设计的因素及水平分布均匀,不需进行重复试验,误差便可估计出来,因而计算精度较高[2-3]。
近年来,虽有一些关于正交试验设计的文献资料,但主要是针对使用过程中出现的个别问题的讲解,没有对正交试验设计进行系统介绍,为了使广大学生、科研工作者正确利用正交设计进行科研工作,笔者通过实例对正交设计的应用要点进行系统阐述,并详细介绍了利用DPS进行正交设计和数据分析的过程,以帮助使用者进行正确、合理的试验设计与分析。
1 正交试验设计的应用要点
1.1 抓关键因素,设适当水平
影响试验结果的因素有很多,如果都进行考察,不仅会增加工作量,还会影响对试验结果的判断,这时只需将研究的重点放在影响最大的几个因素上。此外,各因素的水平也需合理设置。水平间的范围过大或过小都会使试验结果出现很大偏差,甚至得出错误的结论。此外,进行正交试验前最好对重要因素的水平进行预试验。
1.2 合理选择试验指标
试验指标是指用于衡量试验效果的指示性状。衡量某一因素对试验对象影响的指标有很多,但所用试验指标一定要能简单、有效地反映出因素对研究对象的影响。例如,植物组织培养中研究胚龄对愈伤组织的影响,则有愈伤诱导率、褐化率、出苗率、绿苗率等很多试验指标可供选择。如果研究的目的是比较不同胚龄对幼胚形成愈伤组织的影响,则应选择愈伤诱导率作为试验指标;如果考虑获得较多的幼苗群体,可以绿苗率作为试验指标等。
1.3 正确分析交互作用
因素对试验指标有影响,因素之间的互作对指标也会产生影响。因素之间的交互作用总是存在的,且程度不同。对于交互作用,设计时应引起高度重视。
在试验设计中,表示因素A、B间的交互作用记作A×B,称为1级交互作用;表示因素A、B、C之间的高级交互作用记作A×B×C,称为2级交互作用;依此类推。试验设计中,交互作用一律当作因素看待,这是处理交互作用问题的总原则。一般,当交互作用很小时,可认为因素间不存在交互作用。作为因素,各级交互作用都可以安排在能考察交互作用的正交表的相应列上,但用于考察交互作用的列不影响试验方案的设计及其实施[4]。一个交互作用并不一定只占正交表的1列,而是占有(m-1)p列。表头设计时,交互作用所占列数与因素的水平m有关,与交互作用级数p有关。高级交互作用一般较小,可以忽略。实际上,有时因素间的一级交互作用也不必全部考虑,只考察作用明显,或试验要求必须考察的交互作用,或者将交互作用和其他因素、交互作用合并在一列中考察[4]。
1.4 合理设置空白列
在正交表上没有安排因素或交互作用的列称为空白列,它可以反映试验误差,并以此作为衡量试验因素产生的效应是否可靠的标志。因此,一般试验必须设置空白列,用来衡量试验的可靠程度,否则,必须做重复试验,来提高分析的可靠性[5]。
正交试验中设置空白列具有一定的优势,能够发现因素间不可忽略的交互作用,并能发现一些隐藏的因素[5]。为了对试验结果进行方差分析或回归分析,必须至少留1个空白列,作为“误差”列,在极差分析中要作为“其他因素”列处理。因此,对于因素间互作没有了解的情况下,有必要进行空白列的设计。然而在实际试验中,在所有因素和交互作用已知的情况下设置空白列是对人力物力的浪费。在这种情况下,可在正交表中除去空列的设置,考虑因素间的交互作用并安排尽可能多的因素[1]。在实际试验过程中,如果发现空白列的极差比所有因素的极差大,则说明因素之间可能存在以下2种情况:一是各因素之间可能存在有不可忽略的交互作用;二是试验过程中忽略了对试验结果有重要影响的其他因素。在这种情况下,就必须重新选择或增加试验因素,并尽量在正交表中安排所有的一级交互作用。
1.5 正确选择正交表
传统正交表LM(QN),字母L表示正交表;数字M表示该表有M行,即M个处理;数字N表示试验中要考虑N种效应(包括因素和交互作用);Q表示因素的水平数。正交表L4(23)表示此正交表共有4行即可设置4组处理(表1),最多可以考察3个因素(A、B、C)或3个效应,每个因素有2个水平,2号处理是由A因素的第1水平与B因素的第2水平及C因素的第2水平组合而成[6]。一般,要选用其列数大于或等于因素个数,而试验次数又较少的正交表。正交试验中,各因素的水平数减1之和加1,即为需要的最少处理组合数,若有交互作用,则需要加上交互作用的自由度。在实际应用中,若考察4因素且因素各有2个水平的试验,可选择的正交表有L8(27)、L16(215)2种;如果仅考虑各因素的作用及主要因素间的交互作用,并考虑减少处理和工作量,可选择正交表L8(27);如果不了解因素间的互作并想准确分析各因素的主要效应及因素间的交互作用,最佳选择是利用处理数和列数较多的L16(215)进行正交设计。
1.6 合理设计表头,列出试验方案表
表头设计时,各因素及其交互作用不能任意安排,必须严格按交互作用列表进行安排(表2)。这是有交互作用正交试验设计的一个重要特点,也是关键的一步。在表头设计中,为避免混杂,主要因素、重点要考察的因素、涉及交互作用较多的因素应该优先安排,次要因素、不涉及交互作用的因素后安排。设计好表头(表3)后,把排有因素的各列中的数字换成相应的实际水平,再划去未排因素的列,便得到一个试验方案表。按所列的试验方案进行试验即可。
1.7 正确分析试验结果
正交试验常用的分析方法有极差分析法和方差分析法。极差分析法通过比较极差的大小进而确定因素的主次,极差分析法存在一定的局限性,不能估计试验过程及试验结果测定中必然存在的误差,因而不能区分因素各水平所对应的试验结果的差异究竟是由于水平的改变所引起的,还是由试验误差所引起的。因此,一般应采用方差分析法来弥补极差分析法的不足[1]。随着计算机的迅速普及及统计软件的发展,正交试验结果可利用DPS(Data Processing System)、SPSS(Statistical Product and Service Solutions)、SAS(Statistics Analysis System)等统计软件进行分析,在此不一一赘述。
2 DPS具体实施步骤
DPS统计软件是国内目前唯一一款试验设计及统计分析功能齐全、并在某些方面已处于国际领先地位(如试验设计中大样本时的均匀试验设计、多元统计分析中动态聚类分析)的统计分析软件。DPS既能像Excel那样方便的在工作表里进行基础统计分析,又实现了SPSS高级统计分析功能,而且还提供了十分方便的可视化操作界面[7]。现以DPS为平台对前所述实例进行有互作效应的正交试验的设计与统计分析。
2.1 试验设计
试验设计包括以下3个步骤:一是打开DPS软件,从菜单中找到“试验设计”,选择“正交设计”―“正交设计表”,点击确定,弹出对话框,选择对应的正交表。二是表头设计。用鼠标选中输出的正交表内容―从菜单中找到“试验设计”―选择“正交设计”―“互作设计”,点击确定,弹出因素选择对话框,勾选研究的因素,得到初步设计后正交表。将其表头换成相应研究项目,将各列对应的数字换成各因素的具体水平,得出试验方案列于表。三是按所列试验方案试验,重复2次,并进行数据分析[8-10]。
2.2 试验数据分析
将试验数据输入正交表―用鼠标选中正交表和试验数据―从菜单中找到“试验统计”―选择“正交设计方差分析”―弹出对话框“输入处理和空闲因子总数”(系统自动识别),点击“OK”―“输入空闲因子所在序列号”,将空列的列号输入,点击“OK”―“多重比较方法选择”,勾选SNK法―得到结果。
要想进行正确的试验设计需要对文中所述要点充分了解和把握,并根据研究目的和要求确定好因素、水平,选择好指标,权衡好交互作用的取舍、空白列的设计,合理选择和使用正交表,才能得到准确、科学的结论。总之,要做好试验,必须进行合理的正交设计[11-12]。
3 参考文献
[1] 邓振伟,于萍,陈玲.SPSS软件在正交试验设计、结果分析中的应用[J].电脑学习,2009(5):15-17.
[2] 赵丽坤,郭会灿.微生物培养基优化方法概述[J].石家庄职业技术学院学报,2008,20(4):50-52.
[3] SAUDAGAR P S,SINGHAL R S.Optimization of Nutritional Require-ments and Feeding Strategies for Clavulanic Acid Production by Stre-ptomyces Clavuligerus [J]. Bioresour Technol,2007,98 (10):2010-2017.
[4] 叶红卫.SPSS实现有交互作用的正交试验设计[J].西安文理学院学报:自然科学版,2009,12(4):118-121.
[5] 王伟,黄曙荣.一种无空列正交遗传算法的研究[J].科技信息,2009(26):79-80.
[6] 盖钧镒.试验统计方法[M].1版.北京:中国农业出版社,2000.
[7] 唐启义.DPS数据处理系统――实验设计、统计分析及数据挖掘[M].1版.北京:科学出版社,2010.
[8] 彭海滨.正交试验设计与数据分析方法[J].计量与测试技术,2009(12):39-40,42.
[9] 王万中,峁诗松.试验的设计与分析[M].上海:华东师范大学出版社,1997.
[10] 周晓光,李为民,陈刚,等.一种近正交试验设计方法[J].空军工程大学学报:自然科学版,2010,11(3):84-88.
[11] 刘瑞江,张业旺,闻崇炜,等.正交试验设计和分析方法研究[J].实验技术与管理,2010,27(9):52-55.
[12] 杨淑男,刘彦平.谈正交试验设计方法的推广与应用[J].质量春秋,2011(2):48-50.
转载注明来源:https://www.xzbu.com/8/view-1601089.htm