Полный факторный эксперимент
Первый этап планирования эксперимента для получения линейной модели основан на варьировании факторов на двух уровнях. В этом случае, если число факторов известно, можно сразу найти число опытов, необходимое для реализации всех возможных сочетаний уровней факторов. Простая формула, которая для этого используется, уже приводилась: , где N – число опытов, k – число факторов, 2 – число уровней. В общем случае эксперимент, в котором реализуются всевозможные сочетания уровней факторов, называется полным факторным экспериментом. Если число уровней каждого фактора равно двум, то имеем полный факторный эксперимент типа 2k.
Нетрудно написать все сочетания уровней в эксперименте с двумя факторами. Напомним, что в планировании эксперимента используются кодированные значения факторов: +1 и –1 (часто для простоты записи единицы опускают). Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы – значениям факторов. Будем называть такие таблицы матрицами планирования эксперимента.
Матрица планирования для двух факторов приведена ниже
№ опыта |
x1 |
x2 |
y |
1 |
–1 |
–1 |
y1 |
2 |
+1 |
–1 |
y2 |
3 |
–1 |
+1 |
y3 |
4 |
+1 |
+1 |
y4 |
Каждый столбец в матрице планирования называют вектор-столбцом, а каждую строку – вектор-строкой. Таким образом, мы имеем 2 вектор-столбца независимых переменных и один вектор-столбец параметра оптимизации.
Если для двух факторов все возможные комбинации уровней легко найти прямым перебором (или просто запомнить), то с ростом числа факторов возникает необходимость в некотором приеме построения матриц. Из многих возможных обычно используется три приема, основанные на переходе от матриц меньшей размерности к матрицам большей размерности. Рассмотрим первый. При добавлении нового фактора каждая комбинация уровней исходного плана встречается дважды: в сочетании с нижним и верхним уровнями нового фактора. Отсюда естественно появляется прием: записать исходный план для одного уровня нового фактора, а затем повторить его для другого уровня. Вот как это выглядит при переходе от эксперимента 22 к 23:
№ опыта |
x1 |
x2 |
x3 |
y |
1 |
– |
– |
+ |
y1 |
2 |
+ |
– |
+ |
y2 |
3 |
– |
+ |
+ |
y3 |
4 |
+ |
+ |
+ |
y4 |
5 |
– |
– |
– |
y5 |
6 |
+ |
– |
– |
y6 |
7 |
– |
+ |
– |
y7 |
8 |
+ |
+ |
– |
y8 |
Этот прием распространяется на построение матриц любой размерности.
Рассмотрим второй прием. Для этого введем правило перемножения столбцов матрицы. При построчном перемножении двух столбцов матрицы произведение единиц с одноименными знаками дает +1, а с разноименными –1. Воспользовавшись этим правилом, получим для случая, который мы рассматриваем, вектор-столбец произведения x1x2 в исходном плане. Далее повторим еще раз исходный план, а у столбца произведений знаки поменяем на обратные. Этот прием тоже можно перенести на построение матриц любой размерности, однако он сложнее, тем первый.
Третий прием основан на правиле чередования знаков. В первом столбце знаки меняются поочередно, во втором столбце они чередуются через два, в третьем – через 4, в четвертом – через 8 и т. д. по степеням двойки.
Свойства полного факторного эксперимента типа 2k
Мы научились строить матрицы планирования полных факторных экспериментов с факторами на двух уровнях. Теперь выясним, какими общими свойствами эти матрицы обладают независимо от числа факторов. Говоря о свойствах матриц, мы имеем в виду те из них, которые определяют качество модели. Ведь эксперимент и планируется для того, чтобы получить модель, обладающую некоторыми оптимальными свойствами. Это значит, что оценки коэффициентов модели должны быть наилучшими и что точность предсказания параметра оптимизации не должна зависеть от направления в факторном пространстве, ибо заранее неясно, куда предстоит двигаться в поисках оптимума.
Два свойства следуют непосредственно из построения матрицы. Первое из них – симметричность относительно центра эксперимента – формулируется следующим образом: алгебраическая сумма элементов вектор-столбца каждого фактора равна нулю, или, где j – номер фактора, N – число опытов, i = 1, 2, ..., k .
Второе свойство – так называемое условие нормировки – формулируется следующим образом: сумма квадратов элементов каждого столбца равна числу опытов, или . Это следствие того, что значения факторов в матрице задаются +1 и –1.
Это свойства отдельных столбцов матрицы планирования. Теперь остановимся на свойстве совокупности столбцов. Сумма почленных произведений любых двух вектор-столбцов матрицы равна нулю, или
.
Это важное свойство называется ортогональностью матрицы планирования.
Последнее, четвертое свойство называется ротатабельностью, т. е. точки в матрице планирования подбираются так, что точность предсказания значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления.
Полный факторный эксперимент и математическая модель
Для движения к точке оптимума нам нужна линейная модель . Наша цель – найти по результатам эксперимента значения неизвестных коэффициентов модели. До сих пор, говоря о линейной модели, мы не останавливались на важном вопросе о статистической оценке ее коэффициентов. Теперь необходимо сделать ряд замечаний по этому поводу. Можно утверждать, что эксперимент проводится для проверки гипотезы о том, что линейная модель адекватна. Греческие буквы использованы для обозначения «истинных» генеральных значений соответствующих неизвестных. Эксперимент, содержащий конечное число опытов, позволяет только получить выборочные оценки для коэффициентов уравнения . Их точность и надежность зависят от свойств выборки и нуждаются в статистической проверке. Как производится такая проверка, будет показано ниже. А пока займемся вычислением оценок коэффициентов. Их можно вычислить по простой формуле
,
обоснование которой будет приведено ниже. Воспользуемся этой формулой для подсчёта коэффициентов и :
,
.
Благодаря кодированию факторов расчет коэффициентов превратился в простую арифметическую процедуру. Для подсчета коэффициента используется вектор-столбец х1, а для – столбец x2. Остается неясным, как найти . Если уравнение справедливо, то оно верно и для средних арифметических значений переменных: . Но в силу свойства симметрии . Следовательно, . Мы показали, что есть среднее арифметическое значений параметра оптимизации. Чтобы его получить, необходимо сложить все y и разделить на число опытов. Чтобы привести, эту процедуру в соответствие с формулой для вычисления коэффициентов, в матрицу планирования удобно ввести вектор-столбец фиктивной переменной x0, которая принимает во всех опытах значение +1. Это было уже учтено в записи формулы, где j принимало значения от 0 до k.
Теперь у нас есть все необходимое, чтобы найти неизвестные коэффициенты линейной модели
.
Коэффициенты при независимых переменных указывают на силу влияния факторов. Чем больше численная величина коэффициента, тем большее влияние оказывает фактор. Если коэффициент имеет знак плюс, то с увеличением значения фактора параметр оптимизации увеличивается, а если минус, то уменьшается. Величина коэффициента соответствует вкладу данного фактора в величину параметра оптимизации при переходе фактора с нулевого уровня на верхний или нижний.
Иногда удобно оценивать вклад фактора при переходе от нижнего уровня к верхнему уровню. Вклад, определенный таким образом, называется вкладом фактора (иногда его называют основным или главным эффектом). Он численно равен удвоенному коэффициенту. Для качественных факторов, варьируемых на двух уровнях, основной уровень не имеет физического смысла. Поэтому понятие «эффект фактора» является здесь естественным.
Планируя эксперимент, на первом этапе мы стремимся получить линейную модель. Однако у нас нет гарантии, что в выбранных интервалах варьирования процесс описывается линейной моделью. Существуют способы проверки пригодности линейной модели (проверка адекватности). А если модель нелинейна, как количественно оценить нелинейность, пользуясь полным факторным экспериментом?
Один из часто встречающихся видов нелинейности связан с тем, что эффект одного фактора зависит от уровня, на котором находится другой фактор. В этом случае говорят, что имеет место эффект взаимодействия двух факторов. Полный факторный эксперимент позволяет количественно оценивать эффекты взаимодействия. Для этого надо, пользуясь правилом перемножения столбцов, получить столбец произведения двух факторов. При вычислении коэффициента, соответствующего эффекту взаимодействия, с новым вектор-столбцом можно обращаться так же, как с вектор-столбцом любого фактора. Для полного факторного эксперимента 22 матрица планирования с учетом эффекта взаимодействия будет иметь вид
№ опыта |
x0 |
x1 |
x2 |
x1x2 |
y |
1 |
+1 |
+1 |
+1 |
+1 |
y1 |
2 |
+1 |
–1 |
+1 |
–1 |
y2 |
3 |
+1 |
–1 |
–1 |
+1 |
y3 |
4 |
+1 |
+1 |
–1 |
–1 |
y4 |
Очень важно, что при добавлении столбцов эффектов взаимодействий все рассмотренные свойства матриц планирования сохраняются.
Теперь модель выглядит следующим образом:
.
Коэффициент вычисляется обычным путем
.
Столбцы x1 и x2 задают планирование – по ним непосредственно определяются условия опытов, а столбцы x0 и x1x2 служат только для расчета.
Обращаем ваше внимание на то, что при оптимизации мы стремимся сделать эффекты взаимодействия возможно меньшими. В задачах интерполяции, напротив, их выявление часто важно и интересно.
С ростом числа факторов число возможных взаимодействий быстро растет. Мы рассмотрели самый простой случай, когда имелось одно взаимодействие. Обратимся теперь к полному факторному эксперименту 23.
№ опыта |
x0 |
x1 |
x2 |
x3 |
x1x2 |
x1x3 |
x2x3 |
x1x2x3 |
y |
1 |
+ |
– |
– |
+ |
+ |
– |
– |
+ |
y1 |
2 |
+ |
+ |
– |
– |
– |
– |
+ |
+ |
y2 |
3 |
+ |
– |
+ |
– |
– |
+ |
– |
+ |
y3 |
4 |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
y4 |
5 |
+ |
– |
– |
– |
+ |
+ |
+ |
– |
y5 |
6 |
+ |
+ |
– |
+ |
– |
+ |
– |
– |
y6 |
7 |
+ |
– |
+ |
+ |
– |
– |
+ |
– |
y7 |
8 |
+ |
+ |
+ |
– |
+ |
– |
– |
– |
y8 |
Эффект взаимодействия x1x2x3 получается перемножением всех трех столбцов и называется эффектом взаимодействия второго порядка. Эффект взаимодействия двух факторов называется эффектом взаимодействия первого порядка. Вообще, эффект взаимодействия максимального порядка в полном факторном эксперименте имеет порядок, на единицу меньший числа факторов. Довольно часто применяются синонимы: парные эффекты взаимодействия (x1x2, x2x3...), тройные (x1x2x3, x2x3x4...) и т. д.
Полное число всех возможных эффектов, включая b0, линейные эффекты и взаимодействия всех порядков, равно числу опытов полного факторного эксперимента. Чтобы найти число возможных взаимодействий некоторого порядка, можно воспользоваться обычной формулой числа сочетаний
,
где k – число факторов, m – число элементов во взаимодействии. Так, для плана 24 число парных взаимодействий равно шести
.
Поясним физический смысл эффекта взаимодействия следующим примером. Пусть на некоторый химический процесс влияют два фактора: температура и время реакции. В области низких температур увеличение времени увеличивает выход продукта. При переходе в область высоких температур эта закономерность нарушается. Здесь, напротив, необходимо уменьшать время реакции. Это и есть проявление эффекта взаимодействия.
Ортогональность матрицы планирования позволяет получить независимые друг от друга оценки коэффициентов. Это означает, что величина любого коэффициента не зависит от того, какие величины имеют другие коэффициенты.
Однако сформулированные выше утверждения справедливы лишь в том случае, если модель включает только линейные эффекты и эффекты взаимодействия. Между тем, существенными могут оказаться коэффициенты при квадратах факторов, их кубах и т. д. Так, для случая существенных квадратичных членов в двухфакторном эксперименте модель можно записать так:
.
Какую информацию о квадратичных членах можно извлечь из полного факторного эксперимента?
Попытка построения вектор-столбцов для и приводит к получению единичных столбцов, совпадающих друг с другом и со столбцом х0. Так как эти столбцы неразличимы, то нельзя сказать, за счет чего получилась величина b0. Она включает значение свободного члена и вклады квадратичных членов. В этом случае говорят, что имеет место смешанная оценка. Это символически записывается следующим образом:
,
где b0 – вычисленный нами коэффициент, а греческими бувами, как принято в статистике, обозначены неизвестные истинные значения свободного члена () и квадратичных коэффициентов (). Если бы мы сделали сколь угодно много опытов, то в пределе получили бы истинные значения коэффициентов. На практике реализуются лишь малые выборки, по которым вычисляются оценки истинных коэффициентов.
По отношению к квадратичной модели для двух факторов получается такая система смешивания:
, , , .
Следовательно, оценки всех коэффициентов, кроме b0, не смешаны.
Число опытов в полном факторном эксперименте превышает число коэффициентов линейной модели, причем тем больше, чем больше факторов. Разность между числом опытов и числом коэффициентов во многих случаях оказывается очень велика, и возникает естественное желание сократить число необходимых опытов.