Как сделать дисперсионный анализ в excel

Однофакторный дисперсионный анализ в Excel

Однофакторный дисперсионный анализ изучает влияния одного фактора на анализируемый признак.

В таблицы приведены статистические данные по количеству изготовленных деталей на заводе каждым мастером в течение каждой недели.

Необходимо выяснить зависимость количества изготовленных деталей от производительности мастера. Уровень значимости равен α=0.05.

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

№ п/пНомер неделиКоличество изготовленных деталей
Первым мастеромВторым мастеромТретьим мастеромЧетвертым мастеромПятым мастером
1.Первая неделя260253258257251
2.Вторая неделя257255255252250
3.Третья неделя259250254253255
4.Четвёртая неделя254254260257251

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

В результате получим решение в виде таблицы.

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Однофакторный дисперсионный анализ
ИТОГИ
ГруппыСчетСуммаСреднееДисперсия
Столбец 141030257,57
Столбец 2410122534,666666667
Столбец 341027256,757,583333333
Столбец 441019254,756,916666667
Столбец 541007251,754,916666667
Дисперсионный анализ
Источник вариацииSSdfMSFP-ЗначениеF критическое
Между группами 94,5423,6253,8002680970,025089214 3,055568276
Внутри групп93,25156,21666667
Итого 187,7519

Из таблицы значения F-критерия равно Fнабл=3.8, а Fкрит=3, правосторонний интервал (3; +∞) Fнабл>Fкрит, отсюда следует, что Fнабл лежит в этом интервале, следовательно, нулевую гипотезу H0 о равенстве групповых матожиданий — отвергаем, следовательно фактор — количества изготовленных деталей зависит от признака — производительности мастера.

Найдём выборочный коэффициент детерминации:

Этот показатель говорит о том, что около половины еженедельного количества изготовленных деталей мастерами связано с номером недели.

Источник

Двухфакторный дисперсионный анализ в EXCEL

Пусть имеется случайная переменная Y , значения которой мы можем измерять. Исследователь предполагает, что эта переменная зависит от 2-х факторов, значения которых мы можем контролировать, т.е. задавать с требуемой точностью. Покажем как методом дисперсионного анализа проверить гипотезу о наличии или отсутствии влияния указанных факторов на зависимую переменную Y .

В этой статье рассмотрим метод дисперсионного анализа в случае двух факторов (Фактор А и Фактор В) (Two Factor ANOVA with Replication).

Обозначения

Отдельные, заданные значения каждого фактора называются уровнями ( levels ) или испытаниями ( treatments ).

Предполагается, что дисперсии всех выборок σ 2 неизвестны, но равны между собой.

Рассмотрим двухфакторный дисперсионный анализ при решении задачи.

Задача

В компании, изготавливающей изделия путем механообработки, необходимо исследовать влияние на качество изделия двух факторов: Метода обработки поверхности детали, и Исходного материала детали (используется сталь с различным легированием).

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Другими словами мы имеем 6 выборок по 3 значения в каждой. Средние этих выборок для каждой комбинации факторов ij можно вычислить по формуле:

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Также для дальнейших вычислений нам потребуется вычислить еще несколько средних значений. Во-первых, вычислим среднее всех измерений, относящихся к каждому уровню i Фактора А:

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Во-вторых, вычислим среднее всех измерений, относящихся к каждому уровню j Фактора В:

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Взаимодействие факторов

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Как видно из диаграммы – синяя и красная линии практически параллельны друг другу. Это означает, что взаимодействие между факторами практически отсутствует (они не влияют друг на друга). Действительно, выбор метода обработки никак не может влиять на выбор конкретного исходного материала.

Вот еще одна диаграмма, демонстрирующая независимость 2-х факторов.

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Обратная ситуация показана на диаграмме ниже, когда оба фактора взаимодействуют.

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Из этой диаграммы видно, что при уровне №1 фактора В (синяя линия) количество дефектов сначала возрастает, затем снижается (когда мы переходим от метода №1 к №2, затем к №3). Мы наблюдаем диаметрально противоположную ситуацию при уровне №2 фактора В (красная линия): количество дефектов сначала снижается, а затем возрастает. В этом случае говорят о наличии взаимодействия факторов.

Возвращаемся к диаграммам взаимодействия. Очевидно, что делать заключение о наличии или отсутствии взаимодействия факторов невозможно лишь по взаимному расположению линий на диаграмме. Для формулирования утверждения о взаимодействии требуется составить математическое выражение. Это выражение должно вычисляться на основании исходных данных, а результат должен сравниваться с неким критическим значением. Займемся этим в следующем разделе.

Определяем причины изменчивости исходных данных

По аналогии с однофакторным дисперсионным анализом общую изменчивость (разброс) значений Y относительно общего среднего (SST = Sum of Squares Total, общая сумма квадратов) определим как сумму нескольких компонентов, в данном случае 4-х:

SST=SSA+SSB+ SS взаим +SSE

SST и все 4 компонента вычисляются на основании имеющихся исходных данных:

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Также в дисперсионном анализе используется понятие среднего квадрата отклонений (Mean Square) или сокращенно MS. Соответственно для SST имеем MST=SST/(N-1), где N= a*b*m является общим количеством измерений (18). Для других SS степени свободы приведены в таблице ниже.

Таким образом, MS имеет смысл средней изменчивости на 1 наблюдение (с некоторой поправкой). Эта поправка отражает тот факт, что MS должна вычисляться не делением SS на соответствующее количество наблюдений, а делением на число степеней свободы (degrees of freedom, DF). Например, чтобы вычислить MST, мы из N (общего количества наблюдений) должны вычесть 1, т.к. в выражении SST присутствует одно (1) среднее значение (аналогично тому, как мы делали при вычислении дисперсии ).

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Сначала тестируют гипотезу об отсутствии взаимодействия между факторами. Мы можем отклонить Н 0 взаим в пользу Н 1взаим при заданном уровне значимости α (альфа), если вычисленное значение тестовой статистики F= MS взаим /MSE больше F критич альфа – значения случайной величины F имеющей распределение Фишера с (b-1)*(a-1) и a*b*(m-1) степенями свободы.

Вычисления в MS EXCEL

В файле примера приведено решение вышеуказанной задачи: вычислены средние значения выборок, суммы квадратов (SS), степеней свобод, средние квадратов отклонений (MS).

Как сделать дисперсионный анализ в excel. Смотреть фото Как сделать дисперсионный анализ в excel. Смотреть картинку Как сделать дисперсионный анализ в excel. Картинка про Как сделать дисперсионный анализ в excel. Фото Как сделать дисперсионный анализ в excel

Для вычислений критических значений в MS EXCEL имеется специальная функция = F.ОБР.ПХ()

Формула для вычисления F 1критич = F.ОБР.ПХ(a-1; a*b*(m-1);альфа)

В MS EXCEL первое p -значение (вероятность того, что случайная величина F 1 = MSА/MSE примет значение более F 01 ) можно вычислить по формуле:

= F.РАСП.ПХ((MSА/MSE; a-1; a*b*(m-1))

Второе p -значение (вероятность того, что случайная величина F 2 = MSВ/MSE примет значение более F 0 2 ) вычисляется по аналогичным формулам.

В нашей задаче p -значения получились 0,000 и 0,253, что значительно меньше обычно принимаемого в качестве уровня значимости 0,05. Таким образом, обе нулевых гипотезы отклоняются.

Источник

Как сделать дисперсионный анализ в excel

п.15. Решение прикладных задач средствами EXCEL .

Однофакторный дисперсионный анализ

В MS Excel для проведения однофакторного дисперсионного анализа использует­ся процедура Однофакторный дисперсионный анализ.

Для проведения дисперсионного анализа необходимо:

•ввести данные в таблицу, так чтобы в каждом столбце оказались данные, соот­ветствующие одному значению исследуемого фактора, а столбцы располагались в порядке возрастания (убывания) величины исследуемого фактора,

•выполнить команду Сервис > Анализ данных;

•в появившемся диалоговом окне Анализ данных в списке Инструменты анализа выбрать процедуру Однофакторный дисперсионный анализ, указав курсором мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку ОК;

•в появившемся диалоговом окне задать Входной интервал, то есть ввести ссылку на диапазон анализируемых данных, содержащий все столбцы данных. Для этого следует навести указатель мыши на верхнюю левую ячейку диапазона данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

•в разделе Группировка переключатель установить в положение по столбцам;

•указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной интервал (навести указатель мыши и щелкнуть левой кноп­кой), далее навести указатель мыши на правое поле ввода Выходной интервал и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верх­нюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведе­но сообщение в случае возможного наложения выходного диапазона на исход­ные данные.

Результаты анализа. Выходной диапазон будет включать в себя результаты дис­персионного анализа: средние, дисперсии, критерий Фишера и другие показатели.

Интерпретация результатов. Влияние исследуемого фактора определяется по величине значимости критерия Фишера, которая находится в таблице Дисперси­онный анализ на пересечении строки Между группами и столбца Р-Значение. В случаях, когда Р-Значение

Изучалось различие в продуктивности воспроизведения одного и того же материала трех групп испытуемых (по 5 человек), различающихся условиями предъявления этого материала для запоминания. Результаты обследования приведены в таблице.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *