Лабораторная работа №11a
Достигаемый уровень значимости

Многие статистические критерии – например, критерии согласия Колмогорова, омега-квадрат, Андерсона-Дарлинга и другие – имеют процентные точки (т.е. критические значения критерия T в зависимости от уровня значимости α и объёма выборки n), которые, начиная с некоторого сравнительного небольшого значения n, при дальнейшем его увеличении изменяются незначительно при постоянном α, асимптотически приближаясь к некоторому предельному значению m. Это свойство показано на рис.11а.1 на примере критерия Колмогорова для уровня значимости 0,1.

рисунок 11а.1

Рис.11а.1. Критические значения Т критерия Колмогорова при уровне значимости 0,1 в зависимости от объёма выборки n.

В таких случаях в качестве табличных значений критериев указывают эти предельные значения. Предельные значения зависят только от уровня значимости, но не зависят от объёма выборки.

Зависимость между предельными значениями критерия m (возможны различные обозначения) и соответствующими значениями 1 - α, называется предельной функцией распределения критерия F(m). Функция F(m) изменяеся в пределах 0..1. При этом, как указано,

1 - F(m) = α                (1)

Например, для критерия Колмогорова предельная функция распределения при простой гипотезе имеет вид

рисунок 11а.2                (2)

Здесь k =1, 2, 3, ... . Часто встречается и видоизменённая запись выражения (2). В соответствии с (1) и (2) уровень значимости для некоторого m

рисунок 11а.3                (3)

При этом для критерия Колмогорова уже при n = 20 ошибка в определении уровня значимости, обусловленная различиями m и T, незначительна.

Из (3) можно найти табличные значения (процентные точки) критерия, при соответствующих уровнях значимости, например, просто подбором.

Уровень значимости (можно сказать, задаваемый уровень значимости) α исследователь обычно задаёт до начала эксперимента, исходя из соображений приемлемой достоверности и возможно меньшей ошибки второго рода. Чаще всего уровень значимости при статистических расчётах принимают 0,01, 0,05 или 0,1.

Однако после проведения эксперимента, т.е. получения выборки, если известна предельная функция распределения критерия, можно рассчитать по полученной выборке достигаемый уровень значимости (встречается также наименование «достигнутый уровень значимости»), обозначаемый как р value (пи-уровень, p-уровень) или иногда просто р. Для этого рассчитанное значение критерия m подставляют в выражение для уровня значимости (3) и получают, соответственно, достигаемый уровень значимости (p-уровень вместо задаваемого уровня значимости α).

Достигаемый (или достигнутый) уровень значимости – это вероятность получить значение статистики такое, как получилось в эксперименте, или ещё более экстремальное (чаще всего более высокое) при справедливости нулевой гипотезы.

Оценка проверяемой гипотезы путём сравнения табличного и расчётного значения критерия при заданном уровне значимости α может быть вполне достаточна, но расчёт достигаемого уровня значимости более информативен.

Пример 11а.1. При испытаниях картона получена выборка значений его толщины, мкм: 163, 164, 159, 169, 164, 168, 171, 168, 159, 161, 165, 167, 168, 169, 171, 170, 166, 159, 160, 166, 165, 169, 171, 160, 166, 168, 165, 168, 160, 168, 167, 161, 157, 164, 163, 162, 166, 167, 166, 159, 167, 160, 165, 164, 162, 173, 162, 169, 163, 163, 158, 166, 169, 170, 168, 169, 163, 166, 167, 162, 167, 169, 164, 173. Рассчитать достигаемый уровень значимости при проверке по критерию Колмогорова простой гипотезы о том, что выборка взята из нормально распределённой случайной величины с параметрами: математическое ожидание 165 мкм и среднеквадратическое отклонение 5 мкм.

Во многих программно-статистических пакетах для ряда критериев предусмотрен расчёт р-уровня. Рассчитать достигаемый уровень значимости возможно также в MS Excel. Вариант выполнения примера показан на рисунке 11а.2.

рисунок 11а.2

Рис.11а.2. Вариант выполнения примера 11а.1.

Сортируем результаты по возрастанию (выстраиваем в вариационный ряд), рассчитываем объём выборки n (функция СЧЁТ), вводим значения М и σ. В соответствии с методикой, изложенной в работе 11, находим расчётное значение критерия Колмогорова, которое здесь обозначено m.

Далее по формуле (3) находим достигнутый уровень значимости. В формуле (3) значение p-уровня находится суммированием значений, получаемых при k = 1… ∞. Но уже при k = 1..10 p-уровень можно рассчитать с достаточно высокой точностью. Поэтому рассчитываем слагаемые в формуле (3) при k от 1 до 10, и, суммируя их, получаем p-уровень. Лист электронной таблицы следует создавать так, чтобы при вводе других данных, в том числе и в ином количестве, электронная таблица автоматически пересчитывалась. Получаем достигнутый уровень значимости около 0,386.

Если бы мы изначально задали уровень значимости, например, 0,1 (соответствующее табличное значение критерия 1,224, более точно 1,2238 - см. табл. 11.1), ясно, что оснований отвергнуть нулевую гипотезу по полученной выборке не было бы. Если бы p-уровень получился меньше 0,1, например, 0,07 , нулевую гипотезу пришлось бы отвергнуть на принятом уровне значимости 0,1. Таким образом, чем ниже р-уровень, тем сильнее данные свидетельствуют против нулевой гипотезы в пользу альтернативы, и наоборот, чем выше р, тем сильнее данные свидетельствуют в пользу нулевой гипотезы.

Задание.
1. Критерий согласия Ватсона имеет статистику

рисунок 11а.5

Здесь F(xi) – значения предполагаемой теоретической функции распределения, i - номер элемена в вариационном ряду.

Предельная функция распределения критерия Ватсона:

рисунок 11а.6

По данным примера 11а.1 рассчитать достигаемый уровень значимости при проверке по критерию Ватсона простой гипотезы о том, что выборка взята из нормально распределённой случайной величины с параметрами: математическое ожидание 165 мкм и среднеквадратическое отклонение 5 мкм. Для приемлемой точности расчёта достаточно суммы десяти слагаемых из уравнения предельной функции распределения. Для критерия Ватсона при n >= 20 ошибка при определении уровня значимости незначительна.
2. Найти предельные значения критерия Ватсона при уровнях значимости 0,01, 0,05, 0,1.

        Далее     Содержание


© В.В.Заляжных

При использовании материалов, пожалуйста, ставьте прямую индексируемую ссылку