Когда лучше заказать детский день рождения в детский сад.

Критерий Купера. Повышение мощности.
В.В. Заляжных

Критерий согласия Купера (Кейпера) [1] применяется для оценки соответствия случайной непрерывной величины по выборке из неё некоторому теоретическому распределению. Его статистику рассчитывают по формуле

рисунок st12-1                         (1)

или

рисунок st12-2                         (2)

Здесь

рисунок st12-3,

рисунок st12-4,

n - объём выборки, хi - элементы выборки в вариационном ряду, F(хi) – значения теоретической функции распределения.

Таблица 1. Процентные точки статистики рисунок st12-5 при простой гипотезе, по данным [1].

α Объём выборки n
10 2030 40100
0,1 1,4877 1,5322 1,5503 1,56081,5839 1,6196
0,05 1,6066 1,6564 1,67601,6869 1,7110 1,7473
0,01 1,8391 1,9027 1,9153 1,9375 1,9637 2,0010

Для уменьшения зависимости значений процентных точек от n предложены также модифицированные статистики, приведённые, например в [2].

Общий недостаток критериев согласия – низкая мощность по близким конкурирующим гипотезам при сравнительно небольших объёмах выборок. В данной статье рассмотрена возможность повышения мощности критерия Купера с использованием статистик вида

рисунок st12-6                         (3)

при k>0, являющихся модификациями статистики (1). Подобным образом возможна также модификация статистики (2). При различии значений процентных точек она даёт те же значения мощности.

Для оценки мощности рассматривали три пары законов распределения, по аналогии с [2] и [3]:

1. Проверяемая гипотеза Н0 норм – соответствие нормальному распределению с плотностью

рисунок st12-7

и параметрами Θ0 = 1 и Θ1 = 0. Альтернативная (конкурирующая) гипотеза Н1 лог – сответствие логистическому распределению с плотностью

рисунок st12-8

c теми же параметрами. При этих параметрах логистическое распределение очень близко к нормальному.

2. Проверяемая гипотеза Н0 норм – соответствие нормальному распределению с той же плотностью и теми же параметрами, как для первого случая. Альтернативная гипотеза Н1 Лап – соответствие распределению Лапласа с плотностью

рисунок st12-9

и теми же параметрами. Распределение Лапласа довольно значительно отличается от нормального распределения при одинаковых параметрах [3], что позволяет дополнительно сравнить мощности критерия при различных значениях k в уравнении (3).

3. Проверяемая гипотеза Н0 Вейб – соответствие распределению Вейбулла с плотностью

рисунок st12-10

и параметрами Θ0 = 2, Θ1 = 2 и Θ2 = 0. Альтернативная гипотеза Н1 гам – соответствие гамма-распределению с плотностью

рисунок st12-11

и параметрами Θ0 = 3,12154, Θ1 = 0,557706 и Θ2 = 0, при которых гамма-распределение наиболее близко к распределению Вейбулла для гипотезы Н0 Вейб.

Мощность исследовали при проверке простых и сложных нулевых гипотез против простых альтернативных гипотез. Значения процентных точек и мощностей рассчитывали методом статистического компьютерного моделирования в MS Excel. Параметры распределений при сложных гипотезах оценивали методом максимального правдоподобия.

Для предварительной оценки оптимального значения k рассчитали мощность критерия при различных уровнях значимости α по различным парам гипотез для статистик вида (3) при моделировании 105 выборок и объёме выборки 100. Такое количество моделируемых выборок не позволяет получить высокую точность результатов, но для предварительной оценки вполне приемлемы приближённые значения. Значение k варьировали в пределах от 0,1 до 2. При этом k, равное 1, приводит к обычному критерию Купера со статистикой (1) или (2).

Полученные результаты показаны на рис. 12.1 - 12.6.

рисунок st12-13

Рис.12.1. Мощность критерия (3) при проверке простой гипотезы Н0 Вейб против гипотезы Н1 гам

рисунок st12-14

Рис.12.2. Мощность критерия (3) при проверке сложной гипотезы Н0 Вейб против гипотезы Н1 гам

рисунок st12-15

Рис.12.3. Мощность критерия (3) при проверке простой гипотезы Н0 норм против гипотезы Н1 лог

рисунок st12-16

Рис.12.4. Мощность критерия (3) при проверке сложной гипотезы Н0 норм против гипотезы Н1 лог

рисунок st12-17

Рис.12.5. Мощность критерия (3) при проверке простой гипотезы Н0 норм против гипотезы Н1 Лап

рисунок st12-18

Рис.12.6. Мощность критерия (3) при проверке сложной гипотезы Н0 норм против гипотезы Н1 Лап

Из рисунков 12.1 - 12.6 видно, что при проверке сложных гипотез значение k не влияет на мощность критерия со статистикой вида (3) по всем трём парам гипотез. При проверке простых гипотез в случае пары Н0 Вейб - Н1 гам значение k также не влияет на мощность. В то же время при простой гипотезе в случаях пар Н0 норм - Н1 лог и Н0 норм - Н1 Лап с уменьшением k от 2 до 0,1 мощность увеличивается. Таким образом, использование статистики вида (3) представляет интерес при проверке на соответствие нормальному распределению при простой гипотезе и значении k, близком к 0,1.

Для уточнения оптимального значения k была определена мощность критерия со статистикой вида (3) при простой гипотезе по парам гипотез Н0 норм - Н1 лог и Н0 норм - Н1 Лап и значениях k, равных 0,01, 0,1 и 0,2. В каждом случае моделировали 2*106 выборок объёмом 100. Результаты приведены в табл.2.

Таблица 2. Мощность статистик вида (3) при простой гипотезе, n = 100.
αk = 0,2k = 0,1k= 0,01
по паре гипотез Н0 норм - Н1 лог
0,010,0440,0450,045
0,050,1370,1370,137
0,10,2190,2190,219
0,150,2870,2870,288
по паре гипотез Н0 норм - Н1 Лап
0,010,1270,1280,129
0,050,3400,3420,343
0,10,4900,4920,493
0,150,5940,5950,598

Из табл. 2 видно, что при уменьшении k от 0,2 до 0,01 мощность увеличивается незначительно. Но, поскольку других условий для выбора k нет, целесообразно принять за оптимальное k = 0,01, т.е. оптимальная статистика имеет вид

рисунок st12-19                        (4)

Вывод: модифицированный критерий Купера со статистикой (4) имеет более высокую мощность при проверке простой гипотезы о нормальном распределении, чем исходный критерий Купера, и потому целесообразно дальнейшее его исследование.

Продолжение исследования далее

       ЛИТЕРАТУРА
1. Kuiper N.H. Tests concerning random points on a circle / N.H. Kui- per // Proc. Konikl. Nederl. Akad. Van Wettenschappen. 1960. Series A, V. 63. P. 38 – 47.
2. Лемешко Б.Ю. О применении и мощности непараметрических критериев согласия Купера, Ватсона и Жанга / Б.Ю. Лемешко, А.А. Горбунова // Измерительная техника. 2013, № 5. – С. 3-9.
3. Лемешко Б. Ю. Критерии проверки отклонения распределения от нормального закона: Руководство по применению / Б. Ю. Лемешко. – М.: НИЦ ИНФРА-М, 2015. – 160 с. – (Научная мысль).

        Далее     Содержание

© В.В. Заляжных
При использовании материалов прямая индексируемая ссылка на сайт обязательна