Рис.11а.1. Функция распределения критерия Гири при различных n.
d- значения статистики критерия Гири.
Если по полученной в эксперименте выборке рассчитать статистику критерия, то ей соответствует некоторое значение функции распределения. По нему можно найти величину, p-value или p-значение, называемую также достигаемым (или достигнутым) уровнем значимости.
Обычно p-value определяют так: вероятность получить такое же или более экстремальное значение статистики критерия по сравнению с полученным, при условии, что проверяемая нулевая гипотеза верна.
Для правосторонних критериев p = 1 - F(n,m)             (1)
Для левосторонних критериев p = F(n,m)
Для двусторонних критериев p = 2min [F(n,m), 1 - F(n,m)]
При любом заданном уровне значимости α <= p проверяемая по критерию гипотеза не отвергается, иначе – отвергается. Таким образом, p-значение более информативно, чем α. По существу, значение p-value показывает вероятность ошибки при отклонении нулевой гипотезы.
Некоторые критерии при n ⟶ ∞ имеют некоторую предельную функцию распределения K(m). Для некоторых критериев согласия уже при сравнительно небольших n имеет место F(n,m) ≈ K(m). Так, на рис.11а.2 показана функция распределения критерия Колмогорова при проверке простых гипотез для некоторых n, а также предельная функция распределения K(λ).
Рис.11а.2. Функция распределения критерия Колмгорова при различных n.
K(λ) - предельная функция распределения;
λ- значения статистики критерия Колмогорова.
Как видно из рис.11а.2, уже при n = 20 функция распределения критерия Колмогорова близка к предельной. Считается, что для критериев Колмогорова, омега-квадрат, Андерсона-Дарлинга, Купера, Ватсона при n >= 20 функция распределения незначительно отличается от предельной, и p-value, соответственно, практически не зависит от n. Табличные значения статистик таких критериев соответствуют значениям предельной функции распределения. Предельные функции этих критериев описаны в виде некоторых зависимостей. Например, для критерия Колмогорова предельная функция распределения при простой гипотезе может быть записана как
                    (2)
Здесь k =1, 2, 3, ... . В соответствии с (1) и (2) для некоторого λ можно записать
                        (3)
То же справедливо для α вместо p.
Из (3) по заданному α можно найти табличное λ, или по рассчитанному по выборке λ найти p. При этом обычно достаточно в (3) использовать k от 1 до 10..15, чтобы ошибка в определении уровня значимости была несущественна.
При проверке сложных гипотез предельные функции распределения с приемлемой точностью аппроксимируются различными зависимостями. Так, при проверке по критерию Колмогорова сложной гипотезы о нормальности предельная функция распределения аппроксимируется интегральной функцией гамма-распределения с параметрами α = 6,4721, β = 0,058 и значением аргумента x = λ – 0,262.
Однако большинство статистических критериев не имеет предельной функции распределения, и значения их функции распределения F(n,m) всегда сильно зависят от n, как, например, для критерия Гири (см. рис.11а.1). Это в некоторой мере затрудняет нахождение значений p-value.
Пример 11а.1. По выборке объёмом n = 40, полученной при многократных измерениях, проверяется нормальность распределения при неизвестных параметрах. По критерию Колмогорова рассчитана статистика λ = 0,663 (см. лабораторную работу 11). Найти p-value.
Проверяется сложная гипотеза о нормальности распределения, поэтому рассчитываем аппроксимацию предельной функции распределения через функцию гамма-распределения. Она может быть рассчитано в MS Excel по формуле ГАММАРАСП. Выполнение примера показано на рис. 11а.3.
Рис.11а.3.Вариант выполнения примера 11а.1.
Для проверки правильности расчёта вводим в качестве λ значения процентных точек из табл. 11.2. При этом p-value должен соответствовать указанным в табл.11.2 уровням значимости α.
Пример 11а.2. По выборке объёмом n = 30, полученной при многократных измерениях, проверяется нормальность распределения при известных параметрах. Рассчитана статистика критерия Колмогорова λ = 0,672 (см. лабораторную работу 11). Найти p-value.
Проверяется простая гипотеза, поэтому используем выражение (3).Выполнение примера показано на рис. 11а.4.
Рис.11а.3.Вариант выполнения примера 11а.2.
Вводим в ячейку C2 значение статистики критерия, в столбец А значения k. В B4 рассчитываем выражение под знаком суммы из (3), при этом указываем для λ абсолютную адресацию и копируем B4 вниз. В C4 рассчитываем (3) для k=1, указав абсолютную адресацию для B4. При копировании C4 вниз получаем в каждой последующей ячейке значение из (3) при соответствующем диапазоне k. Например, в C10 получаем значение из (3) при k = 1..7. Уже при k = 3 получаем p-value с приемлемой точностью, т.к. далее изменения незначительны. Для проверки правильности расчёта вводим в качестве лямбда процентные точки из табл. 11.1. При этом p-value должен соответствовать указанным в табл.11.1 уровням значимости α.
Задание.
1. Выполнить примеры 11а.1 и 11а.2.
2. Критерий согласия Ватсона имеет предельную функцию распределения
По выборке объёмом n = 50, полученной при многократных измерениях, проверяется нормальность распределения при известных параметрах. Рассчитана статистика критерия Ватсона m = 0,102. Найти p-value. Для проверки правильности расчёта: m = 0,1513 должно соответствовать α = 0,1.
        Далее     Содержание