Критерии равномерности. Оценка мощности.
В.В. Заляжных

Введение.
Оценка равномерности распределения непрерывной случайной величины Х по выборке имеет большое теоретическое и практическое значение, в частности, при статистическом моделировании, при описании погрешностей многих измерительных приборов и др. Известно значительное количество статистических критериев, применимых для оценки равномерности - как общих критериев согласия, так и специальных критериев равномерности. Наиболее важным показателем, характеризующим эффективность того или иного критерия, является его мощность, которая зависит от объёма выборки, допускаемого (принятого) уровня значимости, нулевой и альтернативной гипотез.

В работе [1] проведён сравнительный анализ мощности различных критериев при проверке простой гипотезы равномерности на интервале [0;1]. При этом нулевая гипотеза:

Н0: X ∈ Rav (0,1),
где Rav (0,1) – равномерное распределение случайной величины Х на интервале [0;1].

В качестве альтернативных гипотез в [1] рассматривали принадлежность случайной величины Х трём стандартным (те. на интервале [0,1]) бета- распределениям Ве(a;b), где a и b – параметры формы:

Н1: F(x) = Ве(1,5; 1,5);
Н2: F(x) = Ве(0,8; 1);
Н3: F(x) = Ве(1,1; 0,9);
Здесь F(x) – интегральная функция распределения.

Графики функций и плотностей распределения по рассматриваемым гипотезам показаны на рис.1 и рис.2 (рисунки взяты из [1]).

рисунок st14-1

Рис.14.1. Функции распределения, соответствующие рассматриваемым гипотезам.

рисунок st14-2

Рис.14.2. Плотности распределения, соответствующие рассматриваемым гипотезам.

Значения мощностей для различных критериев, приведённые в [1], обобщены там же при объёме выборки n = 100 и уровне значимости 0,1. Однако при практическом выборе конкретного критерия это не совсем удобно.

Эта статья составлена на основе результатов, приведённых в [1]. При этом названия критериев, рассмотренных в [1], здесь и в последующих статьях сайта сокращены:
ШЕР - Шермана
КИМ - Кимбелла
М2 - Морана 2
ЧС - Ченга-Спиринга
Т1 - Хегази-Грина Т1
Т2 - Хегази-Грина Т2
Т1* - Хегази-Грина Т1*
Т2* - Хегази-Грина Т2*
ЯНГ - Янга
ФР - Фросини
ГКМ- Гринвуда - Кэсенберри - Миллера
НБ2 - Неймана-Барона N2
НБ3 - Неймана-Барона N3
НБ4 - Неймана-Барона N4
ДВМ - Дудевича-ван дер Мюлена
МЭК2 - модификация энтропийного критерия HY2(m,n) при оптимальных значениях m
КР1 - Кресси 1
КР2 - Кресси 2
ПАР - Пардо
ШВ - Шварца
КОЛ - Колмогорова
КУП - Купера
КМС - Крамера-Мизеса-Смирнова (омега-квадрат)
ВАТ - Ватсона
АД - Андерсона-Дарлинга
ZA - Жанга ZA
ZC - Жанга ZC
ZK - Жанга ZK
ХИ2 - хи-квадра Пирсона

Критерии Морана 1 и Гринвуда не рассматривались, т.к. они имеют мощности, соответствующие критерию Кимбелла.

Цель работы:
Выявить наиболее эффективные по мощности критерии для оценки равномерности непрерывной случайной величины.

Основные результаты.
В таблицах 1, 2, 3, составленных по данным [1], указаны по два наиболее мощных критерия для конкретных альтернативных гипотез, объёмов выборки n и уровней значимости α.

Примечания к таблицам:
1. Названия критериев с одинаковой мощностью приведены через дефис.
2. Если на первом месте находится два или больше критериев, второе место не определялось (прочерк).

Таблица 1 - Наиболее мощные критерии при альтернативной гипотезе Н1
n Место Уровень значимости
0,01 0,025 0,05 0,1 0,15
Критерий / мощность
10 1 МЭК2 / 0,036 МЭК2 / 0,083 МЭК2 / 0,151 МЭК2 / 0,265 МЭК2 / 0,362
2 ДВМ / 0,035 ДВМ / 0,080 ДВМ / 0,15 ДВМ / 0,254 ДВМ / 0,347
20 1 МЭК2 / 0,082 МЭК2 / 0,163 МЭК2 / 0,262 МЭК2 / 0,407 МЭК2 / 0,515
2 ДВМ / 0,071 ДВМ / 0,140 ДВМ / 0,228 ДВМ / 0,361 ДВМ / 0,464
30 1 МЭК2 / 0,130 МЭК2 / 0,250 МЭК2 / 0,373 МЭК2 / 0,532 МЭК2 / 0,636
2 КР2 / 0,112 КР2 / 0,206 КР2 / 0,315 КР2 / 0,465 КР2 / 0,570
40 1 МЭК2 / 0,211 МЭК2 / 0,346 МЭК2 / 0,481 МЭК2 / 0,638 МЭК2 / 0,733
2 КР2 / 0,176 КР2 / 0,298 КР2 / 0,424 КР2 / 0,582 КР2 / 0,681
50 1 МЭК2 / 0,274 МЭК2 / 0,421 МЭК2 / 0,557 МЭК2 / 0,704 МЭК2 / 0,789
2 КР2 / 0,225 КР2 / 0,360 КР2 / 0,492 КР2 / 0,644 КР2 / 0,736
100 1 МЭК2 / 0,540 МЭК2 / 0,687 МЭК2 / 0,793 МЭК2 / 0,883 МЭК2 / 0,925
2 ZА / 0,477 ZА / 0,632 ZА / 0,748 ZА / 0,850 ZА / 0,899
150 1 МЭК2 / 0,764 МЭК2 / 0,863 МЭК2 / 0,921 МЭК2 / 0,963 МЭК2 / 0,979
2 ZА / 0,733 ZА / 0,847 ZА / 0,913 ZА / 0,958 ZА / 0,975
200 1 МЭК2 / 0,896 МЭК2 / 0,948 МЭК2-ZA / 0,974 МЭК2-ZA / 0,990 МЭК2-ZA / 0,995
2 НБ2 / 0,891 ZА / 0,947 - - -
300 1 НБ2 / 0,988 НБ2 / 0,996 НБ2-ZA-ZC / 0,998 ZA / 1 НБ2-ZA-ZC / 1
2 ZA / 0,986 ZА / 0,995 - МЭК2-ZС-МЭК2-НБ2-НБ3-НБ4 / 0,999 -

Таблица 2 - Наиболее мощные критерии при альтернативной гипотезе Н2
n Место Уровень значимости
0,01 0,025 0,05 0,1 0,15
Критерий / мощность
10 1 ZC / 0,041 ZC / 0,078 ZC / 0,123 ZC / 0,193 АД / 0,256
2 АД / 0,036 АД / 0,071 АД / 0,116 АД / 0,192 ZC / 0,251
20 1 ZC / 0,063 ZC / 0,112 ZC / 0,167 АД / 0,253 АД / 0,324
2 АД / 0,059 АД / 0,107 АД / 0,165 ZC / 0,247 ZC / 0,310
30 1 ZC / 0,087 ZC / 0,147 АД / 0,215 АД / 0,315 АД / 0,390
2 АД / 0,084 АД / 0,145 ZC / 0,211 ZC / 0,300 Т1 / 0,368
40 1 ZC-АД / 0,111 ZC / 0,184 АД / 0,263 АД / 0,371 АД / 0,449
2 - АД / 0,181 ZC / 0,254 ZC / 0,350 Т1 / 0,425
50 1 АД / 0,141 АД / 0,225 АД / 0,313 АД / 0,426 АД / 0,505
2 ZC /0,139 ZC / 0,218 ZC / 0,298 ZC / 0,399 Т1 / 0,478
100 1 АД / 0,308 АД / 0,426 АД / 0,533 АД / 0,648 АД / 0,718
2 ZC /0,287 ZC / 0,400 ZC / 0,498 Т1 / 0,610 Т1 / 0,685
150 1 АД / 0,475 АД / 0,601 АД / 0,700 АД / 0,795 АД / 0,846
2 ZC /0,442 ZC / 0,564 ZC / 0,659 Т1 / 0,760 Т1 / 0,817
200 1 АД / 0,624 АД / 0,737 АД / 0,817 АД / 0,885 АД / 0,919
2 ZC /0,584 ZC / 0,701 ZC / 0,781 Т1 / 0,856 Т1 / 0,897
300 1 АД / 0,829 АД / 0,897 АД / 0,938 АД / 0,968 АД / 0,980
2 ZC /0,799 ZC / 0,874 ZC / 0,918 Т1-ZC-НБ2 / 0,952 Т1 / 0,969

Таблица 3 - Наиболее мощные критерии при альтернативной гипотезе Н3
n Место Уровень значимости
0,01 0,025 0,05 0,1 0,15
Критерий / мощность
10 1 АД / 0,023 АД / 0,049 АД / 0,086 АД / 0,151 ХИ2 / 0,214
2 КМС-ZA-Т1-Т2-ФР / 0,022 Т1-ФР-ZC / 0,047 Т1-ФР / 0,084 Т1 / 0,149 АД / 0,209
20 1 АД / 0,037 Т1-ФР-АД / 0,072 Т1-ФР-АД / 0,119 АД / 0,197 АД / 0,262
2 Т1-ФР / 0,036 - - Т1-ФР / 0,196 Т1 / 0,261
30 1 ФР / 0,070 ФР / 0,125 ФР / 0,190 ФР / 0,285 ФР / 0,357
2 АД / 0,053 АД / 0,099 АД / 0,157 АД / 0,244 АД / 0,315
40 1 АД-ФР-Т1 / 0,069 АД / 0,126 АД / 0,192 АД / 0,289 АД / 0,363
2 - Т1 /0,124 ФР / 0,190 ФР / 0,286 ФР / 0,360
50 1 АД-Т1 / 0,088 АД / 0,154 АД / 0,230 АД / 0,333 АД / 0,410
2 - Т1 /0,153 ФР-Т1 / 0,227 ФР-Т1 / 0,330 Т1 / 0,407
100 1 АД / 0,200 АД / 0,303 АД / 0,406 АД / 0,526 АД / 0,604
2 ФР-Т1 /0,197 ФР-Т1 /0,301 ФР-Т1 / 0,402 ФР-Т1 / 0,522 Т1 / 0,600
150 1 АД / 0,325 АД / 0,451 АД / 0,560 АД / 0,675 АД / 0,742
2 ФР-Т1 /0,321 ФР-Т1 /0,446 ФР-Т1 / 0,555 ФР-Т1 / 0,670 Т1 / 0,737
200 1 АД / 0,452 АД / 0,582 АД / 0,685 АД / 0,783 АД / 0,836
2 ФР-Т1 /0,445 Т1 /0,576 ФР-Т1 / 0,678 Т1 / 0,778 Т1 / 0,831
300 1 АД / 0,668 АД / 0,776 АД / 0,849 АД / 0,909 АД / 0,937
2 ФР-Т1 /0,660 Т1 /0,769 ФР-Т1 / 0,844 Т1 / 0,905 Т1 / 0,933

При составлении таблиц 1, 2, 3 и в дальнейшем учтены ошибочные значения мощностей, приведённые в [1] и обусловленные, видимо, опечатками. Ошибочные и действительные значения приведены в таблице 4.

Таблица 4 - Ошибочные и действительные значения мощностей
КритерийnГипотезаУровень значимости Ошибочное значение Действительное значение
ХИ2 10Н1 0,010,0250,0025
ХИ2 10Н2 0,10,1460,106
КОЛ 20Н1 0,0250,210,021
Т1 20Н2 0,050,0930,150
КОЛ 30Н1 0,0250,2650,0265
НБ2 30Н2 0,050,1290,188
ХИ2 200Н2 0,010,6290,408
ХИ2 300Н2 0,010,4080,629

Таблицы 1, 2, 3 позволяют достаточно уверенно выбрать критерий, если есть основания принять альтернативную гипотезу Н1, Н2 или Н3. Но чаще всего альтернативная гипотеза принимается в общем виде, т.е. что распределение не является равномерным. При этом выбор может быть затруднён, т.к. критерии, наиболее мощные по одним альтернативным гипотезам, часто имеют низкую мощность по другим.

В данной статье для ориентировочного выбора наиболее эффективного критерия при альтернативной гипотезе общего вида принимали следующее допущение: относительная мощность каждого критерия является комбинацией относительных мощностей для гипотез Н1, Н2 и Н3 при равном их вкладе (т.е. одинаковом коэффициенте значимости, равном 1/3).

Далее применяли подход, подобный используемому, в частности, в квалиметрии при комплексной оценке качества см., напр, [2]. При различных альтернативных гипотезах, уровнях значимости и объёмах выборок рассчитывали относительные мощности Мотн критериев по соотношению:

Мотн = Мабс / Мбаз,

где Мабс - абсолютное значение мощности, Мбаз - базовая мощность. В качестве базовой мощности при альтернативной гипотезе Н1, Н2 или Н3, некотором объёме выборки и уровне значимости принимали наибольшую абсолютную мощность из всех рассмотренных критериев. Значения базовых мощностей можно найти из таблиц 1, 2, 3.

Далее находили относительные мощности для каждого критерия при различных уровнях значимости, объёмах выборки и альтернативной гипотезе общего вида. Эти значения относительных мощностей рассчитывали как средние арифметические относительных мощностей по каждой альтернативной гипотезе, а также как средние геометрические. Их можно использовать для ориентировочного выбора критерия при оценке равномерности распределения непрерывной случайной величины при альтернативной гипотезе общего вида.

В таблицах 5 и 6 указаны по два наиболее эффективных критерия по относительной мощности при альтернативной гипотезе общего вида (более подробно на сттранице Критерии равномерности. Относительная мощность).

Таблица 5. Наиболее эффективные критерии при альтернативной гипотезе общего вида и относительной мощности по среднему арифметическому.
n Место Уровень значимости
0,01 0,025 0,05 0,1 0,15
Критерий / относительная мощность по ср. арифм.
10 1 ZC / 0,647 ZC / 0,673 ZA / 0,722 ZA / 0,775 ZA / 0,797
2 АД / 0,645 ZA / 0,666 ZC / 0,706 ZC / 0,763 ZC / 0,790
20 1 АД / 0,658 ZА / 0,694 ZA / 0,753 ZA / 0,803 ZA / 0,830
2 ZА / 0,628 ZС / 0,678 ZC / 0,731 ZC / 0,788 ZC / 0,821
30 1 ФР / 0,611 ZА / 0,658 ZA / 0,716 ZA / 0,770 ZA / 0,805
2 НБ2 / 0,595 НБ2 / 0,647 ZC / 0,692 ZC / 0,759 ZC / 0,801
40 1 НБ2 / 0,692 ZА / 0,726 ZA / 0,776 ZA / 0,826 ZA / 0,853
2 АД / 0,675 НБ2 / 0,723 ZC / 0,762 ZC / 0,819 ZC / 0,853
50 1 НБ2 / 0,707 ZА / 0,750 ZA / 0,795 ZA / 0,844 ZA / 0,870
2 ZA / 0,690 НБ2 / 0,748 ZC / 0,783 ZC / 0,841 ZC / 0,870
100 1 НБ2 / 0,823 НБ2 / 0,852 ZС / 0,878 ZС / 0,914 ZС / 0,931
2 ZA / 0,782 ZA / 0,836 НБ2 / 0,876 ZA / 0,907 ZA / 0,926
150 1 НБ2 / 0,874 НБ2 / 0,896 ZС / 0,919 ZС / 0,941 АД / 0,960
2 ZA / 0,823 ZС / 0,887 НБ2 / 0,915 НБ2 / 0,937 ZС / 0,952
200 1 НБ2 / 0,900 ZC / 0,922 ZС / 0,941 АД / 0,971 АД / 0,986
2 ZС / 0,875 НБ2 / 0,919 НБ2 / 0,935 ZC / 0,956 ZС / 0,965
300 1 НБ2 / 0,932 АД / 0,962 АД / 0,987 АД / 0,997 АД / 0,999
2 ZС / 0,931 ZС / 0,954 ZС / 0,966 Т1* / 0,977 Т1* / 0,989

Таблица 6. Наиболее эффективные критерии при альтернативной гипотезе общего вида и относительной мощности по среднему геометрическому.
n Место Уровень значимости
0,01 0,025 0,05 0,1 0,15
Критерий / относиельная мощность по ср. арифм.
10 1 КР2 / 0,554 КР2 / 0,607 КР2 / 0,664 ZA / 0,728 ZA / 0,763
2 МЭК2 / 0,553 ДВМ / 0,588 ZА / 0,655 КР2 / 0,727 КР2 / 0,759
20 1 ZA / 0,573 ZА / 0,658 ZA / 0,727 ZA / 0,785 ZA / 0,816
2 НБ2 / 0,522 НБ2 / 0,623 НБ2 / 0,697 НБ2 / 0,758 ZC / 0,797
30 1 ZA / 0,570 ZА / 0,649 ZA / 0,709 ZA / 0,766 ZA / 0,801
2 НБ2 / 0,550 НБ2 / 0,623 НБ2 / 0,678 НБ2 / 0,740 ZC / 0,791
40 1 ZA / 0,657 ZА / 0,718 ZA / 0,771 ZA / 0,822 ZA / 0,850
2 НБ2 / 0,656 НБ2 / 0,705 НБ2 / 0,751 ZC / 0,804 ZC / 0,846
50 1 НБ2 / 0,688 ZА / 0,747 ZA / 0,793 ZA / 0,842 ZA / 0,870
2 ZA / 0,685 НБ2 / 0,738 НБ2 / 0,778 ZC / 0,834 ZC / 0,867
100 1 НБ2 / 0,820 НБ2 / 0,849 ZС / 0,877 ZС / 0,914 ZС / 0,931
2 ZA / 0,779 ZA / 0,834 НБ2 / 0,874 ZA / 0,906 ZA / 0,925
150 1 НБ2 / 0,869 НБ2 / 0,892 ZС / 0,918 ZС / 0,940 АД / 0,958
2 ZС / 0,819 ZС / 0,886 НБ2 / 0,913 НБ2 / 0,936 ZС / 0,951
200 1 НБ2 / 0,896 ZC / 0,921 ZС / 0,940 АД / 0,970 АД / 0,986
2 ZС / 0,873 НБ2 / 0,916 НБ2 / 0,933 ZC / 0,956 ZС / 0,964
300 1 НБ2 / 0,929 АД / 0,960 АД / 0,987 АД / 0,997 АД / 0,999
2 ZС / 0,928 ZС / 0,953 ZС / 0,965 Т1* / 0,977 Т1* / 0,989

По таблицам 5 и 6 можно ориентировочно выбрать критерий для оценки равномерности при альтернативной гипотезе общего вида, известном объёме выборки и уровне значимости. При этом не следует предварительно выбирать объём выборки по таблицам 5 и 6, т.к. базовые значения мощностей различны для разных объёмов выборки.

В большинстве случаев при расчёте как по среднему арифметическому, так и по среднему геометрическому лучшими оказываются одни и те же критерии. Встречающиеся различия обусловлены тем, что если по одной из альтернативных гипотез Н1, Н2 или Н3 абсолютная мощность критерия очень мала, то это сильнее сказывается на снижении относительной мощности при альтернативной гипотезе общего вида в случае расчёта по среднему геометрическому, чем при расчёте по среднему арифметическому.

Видимо, оценка по среднему арифметическому в целом более обоснованна, поскольку в пределах сделанного допущения о равном коэффициенте значимости для гипотез Н1, Н2 и Н3 маленькая мощность по одной из них компенсируется в этом случае большой мощностью по другим. Это в большей мере соответствует альтернативной гипотезе в общем виде, чем при расчёте по среднему геометрическому, когда маленькая мощность по одной из гипотез может более существенно снизить относительную мощность для альтернативной гипотезы общего вида. Тем не менее, в каждом конкретном случае надо выбирать способ расчёта исходя из конкретных соображений, учитывая, что оценка наиболее эффективных критериев являеттся ориентировочной.

Вывод:
При оценке равномерности непрерывной случайной величины в случае альтернативной гипотезы Н1, Н2 или Н3 целесообразно выбираь критерий по таблицам 1, 2 или 3. При альтернативной гипотезе общего вида ориентировочный выбор может быnь сделан по таблицам 5 или 6.

ЛИТЕРАТУРА

1. Лемешко Б.Ю., Блинов П.Ю. Критерии проверки отклонения распределения от равномерного закона: руководство по применению. М.: ИНФРА-М, 2015.- 183с.
2. Варжапетян А.Г. Квалиметрия: учеб. пособие. СПб.: СПбГУАП, 2005.- 176с.: ил.

Recommended most effective tests to assess the uniformity of distribution of continuous random variables under various alternative hypotheses.

        Далее     Содержание

© В.В. Заляжных
При использовании материалов ссылка на сайт обязательна