Гипотеза о равенстве средних значений. Проверка статистических гипотез в MS EXCEL о равенстве среднего значения распределения (дисперсия неизвестна). Проверка статистических гипотез о равенстве средних

Проверка однородности двух выборок производится с помощью критерия Стьюдента (или t – критерия). Рассмотрим постановку задачи проверки однородности двух выборок. Пусть произведено две выборки объемом и . Необходимо проверить нулевую гипотезу о том, что генеральные средние двух выборок равны. То есть, и . n 1

Прежде чем рассматривать методику решения задачи рассмотрим некоторые теоретические положения, используемые для решения задачи. Известный математик У.С. Госсет (ряд своих работ публиковал под псевдонимом Стьюдент) доказал, что статистика t (6.4) подчиняется определенному закону распределения, который в последствии был назван законом распределения Стьюдента (второе название закона – ”t – распределение”).

Среднее значение случайной величины X ;

Математическое ожидание случайной величины X ;

Среднеквадратичного отклонения среднего выборки объема n .

Оценка среднеквадратичного отклонения среднего рассчитывается по формуле (6.5):

Среднеквадратичного отклонения случайной величины X .

Распределение Стьюдента имеет один параметр – количество степеней свободы .

Теперь вернемся к исходной постановке задачи с двумя выборками и рассмотрим случайную величину равную разности средних двух выборок (6.6):

(6.6)

При условии выполнения гипотезы о равенстве генеральных средних справедливо (6.7):

(6.7)

Перепишем соотношение (6.4) применительно нашему случаю:

Оценка среднеквадратичного отклонения может быть выражена через оценку среднеквадратичного отклонения объединенной совокупности (6.9):

(6.9)

Оценка дисперсии объединенной совокупности может быть выражена через оценки дисперсии, рассчитанные по двум выборкам и :

(6.10)

С учетом формулы (6.10) соотношение (6.9) можно переписать в виде (6.11). Соотношение (6.9) является основной расчетной формулой задачи сравнения средних:

При подстановке значения в формулу (6.8) будем иметь выборочное значение t -критерия . По таблицам распределения Стьюдента при количестве степеней свободы и заданном уровне значимости можно определить . Теперь, если , то гипотеза о равенстве двух средних отвергается.

Рассмотрим пример выполнения расчетов для проверки гипотезы равенства двух средних в EXCEL. Сформируем таблицу данных (рис. 6.22). Данные сгенерируем с помощью программы генерации случайных чисел пакета ”Анализ данных”:

X1 выборка из нормального распределения с параметрами объемом ;

X2 выборка из нормального распределения с параметрами объемом ;

X3 выборка из нормального распределения с параметрами объемом ;

X4 выборка из нормального распределения с параметрами объемом .


Проверим гипотезу равенства двух средних (X1-X2), (X1-X3), (X1-X4). В начале рассчитаем параметры выборок признаков X1-X4 (рис. 6.23). Затем рассчитаем значение t - критерия. Расчеты выполнит с помощью формул (6.6) – (6.9) в EXCEL. Результаты расчетов сведем в таблицу (рис. 6.24).

Рис. 6.22. Таблица данных

Рис. 6.23. Параметры выборок признаков X1-X4

Рис. 6.24. Сводная таблица расчета значений t – критерия для пар признаков (X1-X2), (X1-X3), (X1-X4)

По результатам, приведенным в таблице на рис. 6.24 можно сделать заключение, что для пары признаков (X1-X2) гипотеза равенства средних двух признаков отвергается, а для пар признаков (X1-X3), (X1-X4) гипотезу можно считать справедливой.

Такие же результаты можно получить с помощью программы “Двухвыборочный t -тест с одинаковыми дисперсиями” пакета Анализ данных. Интерфейс программы приведен на рис. 6.25.

Рис. 6.25. Параметры программы “Двухвыборочный t - тест с одинаковыми дисперсиями”

Результаты расчетов проверки гипотез равенства двух средних пар признаков (X1-X2), (X1-X3), (X1-X4), полученные с помощью программы приведены на рис. 6.26-6.28.

Рис. 6.26. Расчет значения t – критерия для пары признаков (X1-X2)

Рис. 6.27. Расчет значения t – критерия для пары признаков (X1-X3)

Рис. 6.28. Расчет значения t – критерия для пары признаков (X1-X4)

Двухвыборочный t -тест с одинаковыми дисперсиями иначе называется t -тестом с независимыми выборками. Большое распространение так же получил t -тестом с зависимыми выборками. Ситуация, когда необходимо применять этот критерий возникает тогда, когда одна и та же случайная величина подвергается измерению дважды. Количество наблюдений в обоих случаях одинаково. Введем обозначения для двух последовательных измерений некоторого свойства одних и тех же объектови , , а разность двух последовательных измерений обозначим :

В этом случае формула для выборочного значения критерия приобретает вид:

, (6.13)

(6.15)

В этом случае количество степеней свободы . Проверку гипотезы можно выполнить с помощью программы “Парный двухвыборочный t -тест” пакета анализа данных (рис. 6.29).

Рис. 6.29. Параметры программы “Парный двухвыборочный t -тест”

6.5. Дисперсионный анализ –классификация по одному признаку (F - критерий)

В дисперсионном анализе проверяется гипотеза, которая является обобщением гипотезы равенства двух средних на случай, когда проверяется гипотеза равенства одновременно нескольких средних. В дисперсионном анализе исследуется степень влияния одного или нескольких факторных признаков на результативный признак. Идея дисперсионного анализа принадлежит Р. Фишеру. Он использовал его для обработки результатов агрономических опытов. Дисперсионный анализ применяется для установления существенности влияния качественных факторов на исследуемую величину. Английское сокращенное название дисперсионного анализа – ANOVA (analysis variation).

Общая форма представления данных с классификацией по одному признаку представлена в таблице 6.1.

Таблица 6.1. Форма представления данных с классификацией по одному признаку

5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный интервал для разности средних. Парные выборки 6-3. Гипотеза о равенстве дисперсий 6-4. Гипотеза о равенстве долей 6-5. Доверительный интервал для разности долей


2 Иванов О.В., 2005 В этой лекции… В предыдущей лекции мы проверяли гипотезу о равенстве средних двух генеральных совокупностей и построили доверительный интервал для разности средних для случая независимых выборок. Теперь мы рассмотрим критерий проверки гипотезы о равенстве средних и построим доверительный интервал для разности средних в случае парных (зависимых) выборок. Затем в секции 6-3 будет проверяться гипотеза о равенстве дисперсий, в секции 6-4 – гипотеза о равенстве долей. В заключение мы построим доверительный интервал для разности долей.


5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г Гипотеза о равенстве средних. Парные выборки Постановка проблемы Гипотезы и статистика Последовательность действий Пример


4 Иванов О.В., 2005 Парные выборки. Описание проблемы Что мы имеем 1. Две простые случайные выборки, полученные из двух генеральных совокупностей. Выборки являются парными (зависимыми). 2. Обе выборки имеют объем n 30. Если нет, то обе выборки взяты из нормально распределенных генеральных совокупностей. Что мы хотим Проверить гипотезу о разности средних двух генеральных совокупностей:


5 Иванов О.В., 2005 Статистика для парных выборок Для проверки гипотезы используется статистика: где - разность между двумя значениями в одной паре - генеральное среднее для парных разностей - выборочное среднее для парных разностей - стандартное отклонение разностей для выборки - число пар


6 Иванов О.В., 2005 Пример. Тренинг студентов Группа из 15 студентов прошла тест до тренинга и после. Результаты теста в таблице. Проверим гипотезу для парных выборок на отсутствие влияния тренинга на подготовку студентов на уровне значимости 0,05. Решение. Подсчитаем разности и их квадраты. СтудентДоПосле Σ= 21 Σ= 145


7 Иванов О.В., 2005 Решение Шаг 1. Основная и альтернативная гипотезы: Шаг 2. Задан уровень значимости =0,05. Шаг 3. По таблице для df = 15 – 1=14 находим критическое значение t = 2,145 и записываем критическую область: t > 2,145. 2,145."> 2,145."> 2,145." title="7 Иванов О.В., 2005 Решение Шаг 1. Основная и альтернативная гипотезы: Шаг 2. Задан уровень значимости =0,05. Шаг 3. По таблице для df = 15 – 1=14 находим критическое значение t = 2,145 и записываем критическую область: t > 2,145."> title="7 Иванов О.В., 2005 Решение Шаг 1. Основная и альтернативная гипотезы: Шаг 2. Задан уровень значимости =0,05. Шаг 3. По таблице для df = 15 – 1=14 находим критическое значение t = 2,145 и записываем критическую область: t > 2,145.">




9 Иванов О.В., 2005 Решение Статистика принимает значение: Шаг 5. Сравним полученное значение с критической областью. 1,889


5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г Доверительный интервал для разности средних. Парные выборки Постановка задачи Метод построения доверительного интервала Пример


11 Иванов О.В., 2005 Описание проблемы Что мы имеем Имеем две случайные парные (зависимые) выборки объема n из двух генеральных совокупностей. Генеральные совокупности имеют нормальный закон распределения с параметрами 1, 1 и 2, 2 либо объемы обеих выборок 30. Что мы хотим Оценить среднее значение парных разностей для двух генеральных совокупностей. Для этого построить доверительный интервал для среднего в виде:






5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г Гипотеза о равенстве дисперсий Постановка проблемы Гипотезы и статистика Последовательность действий Пример


15 Иванов О.В., 2005 В ходе исследования… Исследователю может понадобиться проверить предположение, о равенстве дисперсий двух изучаемых генеральных совокупностей. В случае, когда эти генеральные совокупности имеют нормальное распределение, для этого существует F-критерий, называемый также критерием Фишера. В отличие от Стьюдента, Фишер не работал на пивном заводе.


16 Иванов О.В., 2005 Описание проблемы Что мы имеем 1. Две простые случайные выборки, полученные из двух нормально распределенных генеральных совокупностей. 2. Выборки являются независимыми. Это значит, что между субъектами выборок нет связи. Что мы хотим Проверить гипотезу о равенстве дисперсий генеральных совокупностей:














23 Иванов О.В., 2005 Пример Исследователь-медик хочет проверить, есть ли различие между частотой биения сердца курящих и некурящих пациентов (кол-во ударов в минуту). Результаты двух случайно отобранных групп приведены ниже. Используя α = 0,05, выясните, прав ли медик. КурящиеНе курящие


24 Иванов О.В., 2005 Решение Шаг 1. Основная и альтернативная гипотезы: Шаг 2. Задан уровень значимости =0,05. Шаг 3. По таблице для количества степеней свободы числителя 25 и знаменателя 17 находим критическое значение f = 2,19 и критическую область: f > 2,19. Шаг 4. По выборке вычисляем значение статистики: 2,19. Шаг 4. По выборке вычисляем значение статистики:">




5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г Гипотеза о равенстве долей Постановка проблемы Гипотезы и статистика Последовательность действий Пример


27 Иванов О.В., 2005 Вопрос Из 100 случайно отобранных студентов социологического факультета 43 посещают спецкурсы. Из 200 случайно отобранных студентов-экономистов 90 посещают спецкурсы. Отличается ли доля студентов, посещающих спецкурсы, на социологическом и экономическом факультетах? Похоже, что существенно не отличается. Как это проверить? Доля посещающих спецкурсы – доля признака. 43 – количество «успехов». 43/100 – доля успехов. Терминология такая же, как в схеме Бернулли.


28 Иванов О.В., 2005 Описание проблемы Что мы имеем 1. Две простые случайные выборки, полученные из двух нормально распределенных генеральных совокупностей. Выборки являются независимыми. 2. Для выборок выполнено np 5 и nq 5. Это означает, что, по крайней мере, 5 элементов выборки имеют изучаемое значение признака, и, по крайней мере, 5 не имеют. Что мы хотим Проверить гипотезу о равенстве долей признака в двух генеральных совокупностях:






31 Иванов О.В., 2005 Пример. Спецкурсы двух факультетов Из 100 случайно отобранных студентов социологического факультета 43 посещают спецкурсы. Из 200 студентов-экономистов 90 человек посещают спецкурсы. На уровне значимости = 0,05, проверьте гипотезу о том, что нет различия между долей посещающих спецкурсы на двух этих факультетах. 33 Иванов О.В., 2005 Решение Шаг 1. Основная и альтернативная гипотезы: Шаг 2. Задан уровень значимости =0,05. Шаг 3. По таблице нормального распределения находим критические значения z = – 1,96 и z = 1,96 строим критическую область: z 1,96. Шаг 4. По выборке вычисляем значение статистики.


34 Иванов О.В., 2005 Решение Шаг 5. Сравним полученное значение с критической областью. Полученное значение статистики не попало в критическую область. Шаг 6. Формулируем вывод. Нет оснований отвергнуть основную гипотезу. Доля посещающих спецкурсы не отличается статистически значимо.


5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г Доверительный интервал для разности долей Постановка задачи Метод построения доверительного интервала Пример





Рассмотрим ту же задачу, что и в предыдущем пункте 3.4, но только при условии, что объемы выборок и Невелики (меньше 30). В этом случае замена генеральных дисперсий и , входящих в (3.15), на исправленные выборочные дисперсии и может привести к большой ошибке в величине , а следовательно, к большой ошибке в установлении области принятия гипотезы Н0 . Однако если есть уверенность в том, что неизвестные генеральные и Одинаковы (например, если сравниваются средние размеры двух партий деталей, изготовленных на одном и том же станке), то можно, используя распределение Стьюдента, и в этом случае построить критерий проверки гипотезы Н0 X и Y . Для этого вводят случайную величину

, (3.16)

(3.17)

Среднее из исправленных выборочных дисперсий и , служащее точечной оценкой обеих одинаковых неизвестных генеральных дисперсий и . Как оказывается (см. , стр.180), при справедливости нулевой гипотезы Н0 случайная величина Т имеет распределение Стьюдента с степенями свободы независимо от величин и объемов выборок. Если гипотеза Н0 верна, то разница должна быть невелика. То есть экспериментальное значение T Эксп. величины Т должно быть невелико. А именно, должно заключаться в некоторых границах . Выход же его за эти границы мы будем считать опровержением гипотезы Н0 , и допускать это будем с вероятностью, равной задаваемому уровню значимости α .

Таким образом, областью принятия гипотезы Н0 будет являться некоторый интервал , в который значения случайной величины Т должны попадать с вероятностью 1- α :

Величину , определяемую равенством (3.18), для различных уровней значимости α и различных числах K степеней свободы величины Т можно найти в таблице критических точек распределения Стьюдента (таблице 4 Приложения). Тем самым будет найден интервал принятия гипотезы Н0 . И если экспериментальное значение T Эксп величины Т попадет в этот интервал – гипотезу Н0 принимают. Не попадает - не принимают.

Примечание 1. Если нет оснований считать равными генеральные дисперсии и величин Х и Y , то и в этом случае для проверки гипотезы Н0 о равенстве математических ожиданий величин Х и Y допускается использование изложенного выше критерия Стьюдента. Только теперь у величины Т число K степеней свободы следует считать равным не , а равным (см. )

(3.19)

Если исправленные выборочные дисперсии и различаются существенно, то второе слагаемое в последней скобке (3.19) невелико по сравнению с 0,5, так что выражение (3.19) по сравнению с выражением уменьшает число степеней свободы случайной величины Т почти вдвое. А это ведет к существенному расширению интервала принятия гипотезы Н0 и, соответственно, к существенному сужению критической области непринятия этой гипотезы. И это вполне справедливо, так как степень разброса возможных значений разности Будет, в основном, определяться разбросом значений той из величин Х и Y , которая имеет большую дисперсию. То есть информация от выборки с меньшей дисперсией как бы пропадает, что и ведет к большей неопределенности в выводах о гипотезе Н0 .

Пример 4. По приведенным в таблице данным сравнить средние удои коров, получавших различные рационы. При проверке нулевой гипотезы Н0 о равенстве средних удоев принять уровень значимости α =0,05.

Поголовье коров, получавших рацион

(Голов )

Среднесуточный удой в пересчете на базисную жирность

(Кг/на голову )

Среднеквадратическое отклонение суточной молочной продуктивности коров

(Кг/на голову )

. Так как приведенные табличные данные получены на основании малых выборок объемами =10 и =8, то для сравнения математических ожиданий среднесуточных удоев коров, получавших тот и другой кормовые рационы, мы должны использовать теорию, изложенную в этом пункте. Для этого в первую очередь выясним, позволяют ли найденные исправленные выборочные дисперсии =(3,8)2=14,44 и =(4,2)2=17,64 считать равными генеральные дисперсии и . Для этого используем критерий Фишера-Снедекора (см. пункт 3.3). Имеем:

По таблице критических точек распределения Фишера-Снедекора для α =0,05; K 1 =8-1=7 и K 2 =10-1=9 находим

И так как , то у нас нет оснований при данном уровне значимости α =0,05 отвергать гипотезу H 0 о равенстве генеральных дисперсий и .

Теперь, в соответствии с (3.17) и (3.16), подсчитаем экспериментальное значение величины Т :

Далее, по формуле находим число K степеней свободы величины Т : K =10+8-2=16. После этого для п0+8-2=16. ооды (3.16) подсчитаем экспериментальное значение величины Т: Ы кормовые рационы, мы должны испол α =0,05 и K =16 по таблице критических точек распределения Стьюдента (таблица 4 Приложения) находим : =2,12. Таким образом, интервалом принятия гипотезы H 0 о равенстве средних удоев коров, получавших рационы № 1 и № 2, является интервал =(-2,12; 2,12). И так как = - 0,79 попадает в этот интервал, то у нас нет оснований отвергать гипотезу H 0 . То есть мы вправе считать, что различие кормовых рационов не сказывается на среднесуточном удое коров.

Примечание 2. В рассмотренных выше пунктах 3.4 и 3.5 рассматривалась нулевая гипотеза H 0 о равенстве М(Х)=М(Y ) при альтернативной гипотезе Н1 об их неравенстве: М(Х)≠М(Y ). Но альтернативная гипотеза Н1 может быть и другой, например, М(Y )>М(X ). На практике этот случай будет иметь место, когда вводится некоторое усовершенствование (положительный фактор), который позволяет рассчитывать на увеличение в среднем значений нормально распределенной случайной величины Y по сравнению со значениями нормально распределенной величины Х . Например, в рацион коров введена новая кормовая добавка, позволяющая рассчитывать на увеличение среднего удоя коров; под культуру внесена дополнительная подкормка, позволяющая рассчитывать на увеличение средней урожайности культуры, и т. д. И хотелось бы выяснить, существенен (значим) или незначим этот введенный фактор. Тогда в случае больших объемов и Выборок (см. пункт 3.4) в качестве критерия справедливости гипотезы H 0 рассматривают нормально распределенную случайную величину

При заданном уровне значимости α Гипотеза H 0 о равенстве М(Х) и М(Y ) будет отвергнута, если экспериментальное значение величины Будет положительным и бόльшим , где

Так как при справедливости гипотезы H 0 М(Z )= 0, то

Иногда оказывается, что средний результат из основной серии опытов отличается от среднего результата другой серии опытов. Необходимо определить случайно или нет, это различие т.е. можно ли считать, что результат эксперимента представляет собой выборка из двух независимых генеральных совокупностей с одинаковыми средними, или средние этих совокупностей не равны.

Формальная постановка этой задачи выглядит следующим образом – изучаются две случайные величины, распределённые по нормальному закону:

, где σ – стандартное отклонение.

Предполагается, что дисперсии и известны, а математические ожидания не известны.

Пусть имеются две серии наблюдений величины Χ и Υ.

Χ: х 1 , х 2 , …, х n 1 .

Υ: y 1 , y 2 , …, y n 2 .

Выдвигаем следующую гипотезу, что m x =m y . На основании наблюдений необходимо подтвердить или опровергнуть эту гипотезу. Если подтвердится нулевая гипотеза, то можно говорить о том, что различия между средними величинами в двух выборках статистически незначимо, т.е. объясняется как случайная ошибка.

Для проверки этой гипотезы используется z-тест. Для этого рассчитывается

z-критерий (z-статистика), который определяется следующим образом:

Среднее арифметическое значение из серии n наблюдений.

z-критерий распределён нормально с нулевым математическим ожиданием и единичной дисперсией.

Н 1: m x ≠ m y

Нулевая гипотеза о том, что средние значения равны: H 0: =

Альтернативная гипотеза о том, что средние значения не равны, выглядит следующим образом: H 1: ≠ .

При альтернативной гипотезе возможны варианты: либо < , либо > . Соответственно мы должны применить двусторонний критерий. Таким образом существуют две критические точки: и .

Эти точки выбираются из условия:

(1) Р(-∞

(2) Р(

По значению определяем левую и правую критические точки.

,

где F(z) – интегральная функция распределения случайной величины Z, а F -1 (…) – обратная функция.

Определение: Пусть функция y = f(x) задана на сегменте , и пусть множеством значений этой функции является сегмент [α, β]. Пусть, далее, каждому y из сегмента [α, β] соответствует только одно значение x из сегмента , для которого f(x) = y. Тогда на сегменте [α, β] можно определить функцию x = f -1 (y), ставя в соответствие каждому y из [α, β] то значение x из , для которого f(x) = y. Функция x = f -1 (y) называется обратной для функции y = f(x).

Значения критических точек можно найти через функцию: =НОРМСТОБР, указав в диалоговом окне значение вероятности () - для нахождения значения ,или же значение (1 - ) – для нахождения значения ).

Величина Z , распределённая нормально с параметрами Z=N(0;1), распределена симметрично:

0,05

Геометрическая интерпретация: вероятность попадания в области отклонения гипотезы равна сумме заштрихованных площадей.

Последовательность проведения тестирования:

1. Вычисляем статистику Z.

2. Задаёмся уровнем значимости .

3. Определяем критические точки, исходя из условий (1) и (2).

4. Сравниваем рассчитанное в п.1 значение Z со значением критических точек:

Если значение Z- статистики будет по абсолютной величине больше чем значение критической точки, то нулевая гипотеза отклоняется при данном уровне значимости . Это означает, что две совокупности, из которых сделана выборка, различны и, следовательно, средние значения и математические ожидания для этих выборок не равны. В противном случае принимается гипотеза о равенстве средних значений, и можно рассматривать эти две совокупности как одну общую с одним и тем же математическим значением.

В пакете EXCEL существует инструмент анализа, который называется «двухвыборочный Z -тест для средних» (Сервис – анализ данных – двухвыборочный Z- тест для средних). Он служит для проверки гипотезы о различии между средними (математическими ожиданиями) двух нормальных распределений с известными дисперсиями.

Когда вызывается этот инструмент, то появляется диалоговое окно, в котором задаются следующие параметры:

* Гипотетическая средняя разность: вводится число, предполагаемой разности между средними для изучаемой генеральной последовательности. Для проверки гипотезы о равенстве средних необходимо ввести значение ноль.

* Дисперсия переменной 1 (известная): вводится известное значение дисперсии случайной величины Х.

* Дисперсия переменной 2 (известная): вводится известное значение дисперсии случайной величины У.

* Метки: если активируем, то первая строка воспринимается как заголовок и не считается.

* Альфа: задаётся уровень значимости , равный вероятности совершить ошибку первого рода.

ЗАДАНИЕ 1:

Известны выборочные данные о диаметре валиков в миллиметрах, изготовляемых автоматом 1 и 2.

Дисперсия для автомата 1: = 5 мм 2 .

Дисперсия для автомата 2: =7 мм 2 .

Уровень значимости = 0,05.

1.Используя двухвыборочный Z- тест для средних проверить для вашего варианта гипотезу о равенстве средних значений.

2.Проверить эту же гипотезу, используя расчётные формулы.

Проверка равенства среднего определенному значению.

Выборки извлечены из совокупности, имеющей нормальное распределение, данные независимы.

Критериальное значение вычисляется по формуле:

где N - размер выборки;

S 2 - эмпирическая дисперсия выборки;

А - предполагаемая величина среднего значения;

X- среднее значение.

Число степеней свободы для t-критерия V = n-1.

Нулевая гипотеза

Н 0: X = А против Н А: X≠А. Нулевая гипотеза о равенстве средних отвергается, если по абсолютной величине критериальное значение больше верхней α/2 % точки t-распределения взятого с V степенями свободы, то есть при │t│> t vα/2 .

Н 0: Х< А против Н А: X > А. Нулевая гипотеза отвергается, если критериальное значение больше верхней α% точки t-распределения взятого с V степенями свободы, то есть при │t│> t vα .

Н 0: Х>А против H А: X < А. Нулевая гипотеза отвергается, если критериальное значение меньше нижней α% точки t-распределения, взятого с V степенями свободы.

Критерий устойчив при малых отклонениях от нормального распределения.

Пример

Рассмотрим пример, представленный на рис. 5.10. Допустим, что нам необходимо проверить гипотезу о равенстве среднего для выборки (ячейки 123:130) величине 0,012.

Сначала находим среднее выборки (=СРЗНАЧ(123:130) в I31) и дисперсию (=ДИСП(I23:I30) в I32). После этого рассчитываем критериальное (=(131-0,012)*КОРЕНЬ(133)/132) и критическое (=СТЬЮДРАСПОБР(0,025;133-1)) значения. Поскольку критериальное значение (24,64) больше критического (2,84), то гипотеза о равенстве среднего 0,012 отвергается.

Рисунок 5.10 Сравнение среднего значения с константой

1. проверить гипотезы о средних и дисперсиях с помощью параметрических критериев Фишера и Кохрена (таблица 5.4);

2. проверить гипотезу о равенстве средних при неравных дисперсиях выборок (для этого в одной из выборок своего варианта убрать 1 или 2 значения) (таблица 5.4);

3. проверить гипотезу о равенстве среднего заданному значению А (таблица 5.5) и данные из 1-го столбца по варианту.

Таблица 5.4

Варианты заданий

Данные эксперимента
Вариант
2,3 2,6 2,2 2,1 2,5 2,6
1,20 1,42 17,3 23,5 2,37 2,85 35,2 26,1 2,1 2,6
5,63 5,62 26,1 27,0 5,67 2,67 35,9 25,8 5,1 5,63
2,34 2,37 23,9 23,3 2,35 2,34 33,6 23,8 2,34 2,38
7,71 7,90 28,0 25,2 2,59 2,58 35,7 26,0 7,63 7,6,1
1,2 1,6 1,7 2,6 1,9 2,8
1,13 1,15 21,6 21,2 2,13 2,16 31,7 1,12 1,12
1,45 1,47 24,7 24,8 2,45 2,47 34,8 24,5 1,49 1,45
3,57 3,59 25,9 25,7 2,55 2,59 36,0 25,7 3,58 3,58
3,3 3,6 2,5 2,4 3,4 3,5
Данные эксперимента
Вариант
7,3 7,6 12,2 12,1 3,5 4,6
6,20 6,42 217,3 230,5 12,37 12,85 75,2 86,1 3,1 4,6
7,63 5,62 264,1 278,0 15,67 14,67 75,9 75,8 5,1 5,63
6,34 5,37 233,9 236,3 12,35 12,34 73,6 73,8 3,34 4,38
7,71 7,90 281,0 255,2 12,59 12,58 85,7 86,0 3,63 4,6,1
6,2 6,6 11,7 12,6 3,9 4,8
4,13 4,15 251,6 261,2 12,13 12,16 71,7 5,12 4,12
5,45 6,47 244,7 247,8 12,45 12,47 74,8 84,5 3,49 4,45
5,57 5,59 250,9 255,7 12,55 12,59 86,0 85,7 3,58 3,58
5,3 5,6 12,5 12,4 3,4 3,5

Таблица 5.5

Значение А

Варианты
2,2 2,2 2,2 6,5 12,2 3,5

В качестве исходных данных в задании можете использовать свои экспериментальные данные.

Отчет должен содержать расчеты статистических характеристик.

Контрольные вопросы:

1. Какие статистические задачи решаются при исследовании технологических процессов производства пищевой промышленности?

2. Каким образом сравниваются статистические характеристики случайных величин?

3. Уровень значимости и доверительная вероятность при достоверности оценки экспериментальных данных.

4. Как осуществляется проверка статистических гипотез с помощью критериев согласия?

5. От чего зависит мощность критерия согласия для анализа экспериментальных выборок?

6. Каким образом осуществояется подбор критерия для решения задач анализа технологических процессов производства пищевых продуктов?

7. Каким образом осуществляется классификация критериев согласия для анализа выборок результатов исследований технологических процессов производства пищевых продуктов?

8. Какие требования предъявляются к выборкам резльтатов исследований технологических процессов производства пищевых продуктов?