Пусть требуется проверить нулевую гипотезу о нормальном законе распределения случайной величины. Уровень значимости принять =0,001 .

Обычно точные параметры гипотетического нормального закона нам неизвестны, поэтому нулевую гипотезу (Н0) словесно можно сформулировать следующим образом: F(х) является функцией нормального распределения с параметрами М(X) =а = и D(X) = .

Для проверки этой нулевой гипотезы найдем точечные оценки математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины:

При проверке гипотезы о нормальном распределении генеральной совокупности сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормальности распределения) частоты. Для этого используются статистика 2 - Пирсона с =k-r-1 степенями свободы (k - число групп, r - число оцениваемых параметров, в настоящем примере оценивались математическое ожидание и среднее квадратическое отклонение, следовательно, r = 2). Если 2расч. 2кр., то нулевая гипотеза отвергается и считается, что предположение о нормальности распределения не согласуется с опытными данными. В противном случае (2расч. < 2кр.) нулевая гипотеза принимается.

Вычисляются теоретические вероятности рi, попадания СВ ХN в частичные интервалы . Пусть, далее, каждому y из сегмента [α, β] соответствует только одно значение x из сегмента , для которого f(x) = y. Тогда на сегменте [α, β] можно определить функцию x = f -1 (y), ставя в соответствие каждому y из [α, β] то значение x из , для которого f(x) = y. Функция x = f -1 (y) называется обратной для функции y = f(x).

Значения критических точек можно найти через функцию: =НОРМСТОБР, указав в диалоговом окне значение вероятности () - для нахождения значения ,или же значение (1 - ) – для нахождения значения ).

Величина Z , распределённая нормально с параметрами Z=N(0;1), распределена симметрично:

0,05

Геометрическая интерпретация: вероятность попадания в области отклонения гипотезы равна сумме заштрихованных площадей.

Последовательность проведения тестирования:

1. Вычисляем статистику Z.

2. Задаёмся уровнем значимости .

3. Определяем критические точки, исходя из условий (1) и (2).

4. Сравниваем рассчитанное в п.1 значение Z со значением критических точек:

Если значение Z- статистики будет по абсолютной величине больше чем значение критической точки, то нулевая гипотеза отклоняется при данном уровне значимости . Это означает, что две совокупности, из которых сделана выборка, различны и, следовательно, средние значения и математические ожидания для этих выборок не равны. В противном случае принимается гипотеза о равенстве средних значений, и можно рассматривать эти две совокупности как одну общую с одним и тем же математическим значением.

В пакете EXCEL существует инструмент анализа, который называется «двухвыборочный Z -тест для средних» (Сервис – анализ данных – двухвыборочный Z- тест для средних). Он служит для проверки гипотезы о различии между средними (математическими ожиданиями) двух нормальных распределений с известными дисперсиями.

Когда вызывается этот инструмент, то появляется диалоговое окно, в котором задаются следующие параметры:

* Гипотетическая средняя разность: вводится число, предполагаемой разности между средними для изучаемой генеральной последовательности. Для проверки гипотезы о равенстве средних необходимо ввести значение ноль.

* Дисперсия переменной 1 (известная): вводится известное значение дисперсии случайной величины Х.

* Дисперсия переменной 2 (известная): вводится известное значение дисперсии случайной величины У.

* Метки: если активируем, то первая строка воспринимается как заголовок и не считается.

* Альфа: задаётся уровень значимости , равный вероятности совершить ошибку первого рода.

ЗАДАНИЕ 1:

Известны выборочные данные о диаметре валиков в миллиметрах, изготовляемых автоматом 1 и 2.

Дисперсия для автомата 1: = 5 мм 2 .

Дисперсия для автомата 2: =7 мм 2 .

Уровень значимости = 0,05.

1.Используя двухвыборочный Z- тест для средних проверить для вашего варианта гипотезу о равенстве средних значений.

2.Проверить эту же гипотезу, используя расчётные формулы.

Пример . Доходы аптек одного из микрорайонов города за некоторый период составили 128; 192; 223; 398; 205; 266; 219; 260; 264; 98 (условных единиц). В соседнем микрорайоне за то же время они были равны 286; 240; 263; 266; 484; 223; 335.
Для обеих выборок вычислите среднее, исправленную дисперсию и среднее квадратическое отклонение. Найдите размах варьирования, среднее абсолютное (линейное) отклонение, коэффициент вариации, линейный коэффициент вариации, коэффициент осцилляции.
Предполагая, что данная случайная величина имеет нормальное распределение, определите доверительный интервал для генеральной средней (в обоих случаях).
По критерию Фишера проверьте гипотезу о равенстве генеральных дисперсий. По критерию Стьюдента проверьте гипотезу о равенстве генеральных средних (альтернативная гипотеза – об их неравенстве).
Во всех расчётах уровень значимости α = 0,05.

Решение проводим с помощью калькулятора Проверка гипотезы о равенстве дисперсий .
1. Находим показатели вариации для первой выборки .

x |x - x ср | (x - x ср) 2
98 127.3 16205.29
128 97.3 9467.29
192 33.3 1108.89
205 20.3 412.09
219 6.3 39.69
223 2.3 5.29
260 34.7 1204.09
264 38.7 1497.69
266 40.7 1656.49
398 172.7 29825.29
2253 573.6 61422.1


.



Показатели вариации .
.

R = X max - X min
R = 398 - 98 = 300
Среднее линейное отклонение


Каждое значение ряда отличается от другого в среднем на 57.36
Дисперсия


Несмещенная оценка дисперсии


.

Каждое значение ряда отличается от среднего значения 225.3 в среднем на 78.37
.

.

Коэффициент вариации

Поскольку v>30% ,но v или

Коэффициент осцилляции

.
.


По таблице Стьюдента находим:
T табл (n-1;α/2) = T табл (9;0.025) = 2.262

(225.3 - 59.09;225.3 + 59.09) = (166.21;284.39)

2. Находим показатели вариации для второй выборки .
Проранжируем ряд. Для этого сортируем его значения по возрастанию.
Таблица для расчета показателей.

x |x - x ср | (x - x ср) 2
223 76.57 5863.18
240 59.57 3548.76
263 36.57 1337.47
266 33.57 1127.04
286 13.57 184.18
335 35.43 1255.18
484 184.43 34013.9
2097 439.71 47329.71

Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения .
Простая средняя арифметическая


Показатели вариации .
Абсолютные показатели вариации .
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = X max - X min
R = 484 - 223 = 261
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.


Каждое значение ряда отличается от другого в среднем на 62.82
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).


Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).


Среднее квадратическое отклонение .

Каждое значение ряда отличается от среднего значения 299.57 в среднем на 82.23
Оценка среднеквадратического отклонения .

Относительные показатели вариации .
К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.
Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Интервальное оценивание центра генеральной совокупности .
Доверительный интервал для генерального среднего .

Определяем значение t kp по таблице распределения Стьюдента
По таблице Стьюдента находим:
T табл (n-1;α/2) = T табл (6;0.025) = 2.447

(299.57 - 82.14;299.57 + 82.14) = (217.43;381.71)
С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Проводим проверку гипотезы о равенстве дисперсий:
H 0: D x = D y ;
H 1: D x Найдём наблюдаемое значение критерия Фишера:

Поскольку s y 2 > s x 2 , то s б 2 = s y 2 , s м 2 = s x 2
Числа степеней свободы:
f 1 = n у – 1 = 7 – 1 = 6
f 2 = n x – 1 = 10 – 1 = 9
По таблице критических точек распределения Фишера–Снедекора при уровне значимости α = 0.05 и данным числам степеней свободы находим F кр (6;9) = 3.37
Т.к. F набл Проводим проверку гипотезы о равенстве генеральных средних:


Найдём экспериментальное значение критерия Стьюдента:


Число степеней свободы f = n х + n у – 2 = 10 + 7 – 2 = 15
Определяем значение t kp по таблице распределения Стьюдента
По таблице Стьюдента находим:
T табл (f;α/2) = T табл (15;0.025) = 2.131
По таблице критических точек распределения Стьюдента при уровне значимости α = 0.05 и данному числу степеней свободы находим t кр = 2.131
Т.к. t набл

Проверка равенства среднего определенному значению.

Выборки извлечены из совокупности, имеющей нормальное распределение, данные независимы.

Критериальное значение вычисляется по формуле:

где N - размер выборки;

S 2 - эмпирическая дисперсия выборки;

А - предполагаемая величина среднего значения;

X- среднее значение.

Число степеней свободы для t-критерия V = n-1.

Нулевая гипотеза

Н 0: X = А против Н А: X≠А. Нулевая гипотеза о равенстве средних отвергается, если по абсолютной величине критериальное значение больше верхней α/2 % точки t-распределения взятого с V степенями свободы, то есть при │t│> t vα/2 .

Н 0: Х< А против Н А: X > А. Нулевая гипотеза отвергается, если критериальное значение больше верхней α% точки t-распределения взятого с V степенями свободы, то есть при │t│> t vα .

Н 0: Х>А против H А: X < А. Нулевая гипотеза отвергается, если критериальное значение меньше нижней α% точки t-распределения, взятого с V степенями свободы.

Критерий устойчив при малых отклонениях от нормального распределения.

Пример

Рассмотрим пример, представленный на рис. 5.10. Допустим, что нам необходимо проверить гипотезу о равенстве среднего для выборки (ячейки 123:130) величине 0,012.

Сначала находим среднее выборки (=СРЗНАЧ(123:130) в I31) и дисперсию (=ДИСП(I23:I30) в I32). После этого рассчитываем критериальное (=(131-0,012)*КОРЕНЬ(133)/132) и критическое (=СТЬЮДРАСПОБР(0,025;133-1)) значения. Поскольку критериальное значение (24,64) больше критического (2,84), то гипотеза о равенстве среднего 0,012 отвергается.

Рисунок 5.10 Сравнение среднего значения с константой

1. проверить гипотезы о средних и дисперсиях с помощью параметрических критериев Фишера и Кохрена (таблица 5.4);

2. проверить гипотезу о равенстве средних при неравных дисперсиях выборок (для этого в одной из выборок своего варианта убрать 1 или 2 значения) (таблица 5.4);

3. проверить гипотезу о равенстве среднего заданному значению А (таблица 5.5) и данные из 1-го столбца по варианту.

Таблица 5.4

Варианты заданий

Данные эксперимента
Вариант
2,3 2,6 2,2 2,1 2,5 2,6
1,20 1,42 17,3 23,5 2,37 2,85 35,2 26,1 2,1 2,6
5,63 5,62 26,1 27,0 5,67 2,67 35,9 25,8 5,1 5,63
2,34 2,37 23,9 23,3 2,35 2,34 33,6 23,8 2,34 2,38
7,71 7,90 28,0 25,2 2,59 2,58 35,7 26,0 7,63 7,6,1
1,2 1,6 1,7 2,6 1,9 2,8
1,13 1,15 21,6 21,2 2,13 2,16 31,7 1,12 1,12
1,45 1,47 24,7 24,8 2,45 2,47 34,8 24,5 1,49 1,45
3,57 3,59 25,9 25,7 2,55 2,59 36,0 25,7 3,58 3,58
3,3 3,6 2,5 2,4 3,4 3,5
Данные эксперимента
Вариант
7,3 7,6 12,2 12,1 3,5 4,6
6,20 6,42 217,3 230,5 12,37 12,85 75,2 86,1 3,1 4,6
7,63 5,62 264,1 278,0 15,67 14,67 75,9 75,8 5,1 5,63
6,34 5,37 233,9 236,3 12,35 12,34 73,6 73,8 3,34 4,38
7,71 7,90 281,0 255,2 12,59 12,58 85,7 86,0 3,63 4,6,1
6,2 6,6 11,7 12,6 3,9 4,8
4,13 4,15 251,6 261,2 12,13 12,16 71,7 5,12 4,12
5,45 6,47 244,7 247,8 12,45 12,47 74,8 84,5 3,49 4,45
5,57 5,59 250,9 255,7 12,55 12,59 86,0 85,7 3,58 3,58
5,3 5,6 12,5 12,4 3,4 3,5

Таблица 5.5

Значение А

Варианты
2,2 2,2 2,2 6,5 12,2 3,5

В качестве исходных данных в задании можете использовать свои экспериментальные данные.

Отчет должен содержать расчеты статистических характеристик.

Контрольные вопросы:

1. Какие статистические задачи решаются при исследовании технологических процессов производства пищевой промышленности?

2. Каким образом сравниваются статистические характеристики случайных величин?

3. Уровень значимости и доверительная вероятность при достоверности оценки экспериментальных данных.

4. Как осуществляется проверка статистических гипотез с помощью критериев согласия?

5. От чего зависит мощность критерия согласия для анализа экспериментальных выборок?

6. Каким образом осуществояется подбор критерия для решения задач анализа технологических процессов производства пищевых продуктов?

7. Каким образом осуществляется классификация критериев согласия для анализа выборок результатов исследований технологических процессов производства пищевых продуктов?

8. Какие требования предъявляются к выборкам резльтатов исследований технологических процессов производства пищевых продуктов?