Табличные значения критерия Ирвина для крайних элементов вариационного ряда
В.В. Заляжных

Критерий Ирвина используется для оценки сомнительных значений выборки на грубые ошибки. Порядок его применения следующий.

Находят расчётное значение критерия λ расч= (|хк - хк пред|)/σ,

где хк – сомнительное значение, хк пред – предыдущее значение в вариационном ряду, если хк оценивается от максимальных значений вариационного ряда, или последующее, если хк оценивается от минимальных значений вариационного ряда (Ирвин использовал в общем случае термин «первое значение»); σ – генеральное среднеквадратическое отклонение (СКО) непрерывной нормально распределённой случайной величины.

Если λ расч > λ табл , хк – грубая ошибка. Здесь λ табл– табличное значение (процентная точка) критерия Ирвина.

Возникающие при этом вопросы описаны на странице http://arhiuch.ru/st6.html . В частности, в статье-первоисточнике [1] табличные значения rритерия рассчитаны для нормально распределенной случайной величины при известном генеральном среднеквадратическом отклонении (СКО) σ. Поскольку σ чаще всего неизвестно, Ирвином предложено использовать в расчётах вместо σ выборочное СКО s, определяемое по формуле

рисунок s6.1

где n – объём выборки, хi – элементы выборки, х ср – среднее значение выборки.

Такой подход обычно и используется на практике. Однако приемлемость использования выборочного СКО, и при этом процентных точек для генерального СКО, не подтверждена.

В данной статье приведены табличные значения (процентные точки) критерия Ирвина, рассчитанные методом статистического компьютерного моделирования при использовании выборочного СКО для максимального значения вариационного ряда при стандартном нормальном распределении случайной величины (при других параметрах нормального распределения, а также для минимального значения вариационного ряда получаются такие же результаты). Для каждого объёма выборки n моделировали 106 выборок. Как показали предварительные расчёты, при параллельных определениях различия в значениях процентной точки могут достигать 0,003. Поскольку значения округляли до 0,01, в сомнительных случаях проводили от 2 до 4 параллельных определений.

Кроме того, по данным [1] рассчитали табличные значения критерия Ирвина для известного генерального СКО и сопоставили их с приведёнными в [2].

Поскольку при практическом применении критерия Ирвина нередко возникают определённые затруднения из-за отсутствия в литературных источниках табличных значений критерия при некоторых объёмах выборок, были рассчитаны тем же методом статистического компьютерного моделирования некоторые из отсутствующих в [2] табличных значений.

Ясно, что при объёме выборки 2 применение критерия с использованием выборочного СКО не имеет смысла. Это подтверждается тем, что упрощение выражения для расчётного значения критерия при выборочном СКО даёт квадратный корень из двух, что наглядно показывает бессмысленность применения критерия при объёме выборки 2 и выборочном СКО.

Полученные результаты приведены в табл. 1.

Таблица 1 - Табличные значения критерия Ирвина для крайних элементов вариационного ряда.
Объём выборки По генеральному СКО По выборочному СКО
Уровень значимости
0,1 0,050,01 0,10,050,01
2 2,33* 2,77* 3,64* -- -
3 1,79* 2,17* 2,90* 1,621,68 1,72
4 1,58 1,92 2,60 1,551,70 1,88
5 1,45 1,77 2,43 1,451,64 1,93/
6 1,37 1,67 2,30 1,381,60 1,94
7 1,31 1,60 2,22 1,321,55 1,93
8 1,26 1,55 2,14 1,271,51 1,92
9 1,22 1,50 2,09 1,231,47 1,90
10 1,18* 1,46* 2,04* 1,201,44 1,88
11 1,15 1,43 2,00 1,171,42 1,87
12 1,13 1,40 1,97 1,151,39 1,85
13 1,11 1,38 1,94 1,131,37 1,83
14 1,09 1,36 1,91 1,111,35 1,82
15 1,08 1,34 1,89 1,091,33 1,80
20 1,03* 1,27* 1,80* 1,031,27 1,75
25 0,99 1,23 1,74 0,991,22 1,70
30 0,96* 1,20* 1,70* 0,961,19 1,66
35 0,93 1,17 1,66 0,941,16 1,63
40 0,91* 1,15* 1,63* 0,921,14 1,61
45 0,89 1,13 1,61 0,901,12 1,59
50 0,88* 1,11* 1,59* 0,891,10 1,57
60 0,86* 1,08* 1,56* 0,871,08 1,54
70 0,84* 1,06* 1,53* 0,851,06 1,52
80 0,83* 1,04* 1,51* 0,831,04 1,50
90 0,82* 1,03* 1,49* 0,821,03 1,48
100 0,81* 1,02* 1,47* 0,811,02 1,46
200 0,75* 0,95* 1,38* 0,750,95 1,38
300 0,72* 0,91* 1,33* 0,720,91 1,33
500 0,69* 0,88* 1,28* 0,690,88 1,28
1000 0,65* 0,83* 1,22* 0,650,83 1,22
Примечание: значения, помеченные звёздочкой, рассчитаны по данным [1] и при необходимости уточнены при статистическом компьютерном моделировании. Остальные значения рассчитаны при статистическом компьютерном моделировании.

Если сравнить процентные точки для известного генерального СКО, приведённые в табл. 1, с соответствующими процентными точками, приведёнными в [2], то они в нескольких случаях различаются на 0,01, и в одном случае на 0,02. Видимо, приведённые в данной статье процентные точки более точны, поскольку в сомнительных случаях они проверялись статистическим компьютерным моделированием.

Из табл.1 видно, что процентные точки критерия Ирвина при использовании выборочного СКО при сравнительно небольших объёмах выборки заметно отличаются от процентных точек при использовании генерального СКО. Только при значительных объёмах выборки, примерно около 40, процентные точки становятся близки. Таким образом, при использовании критерия Ирвина следует пользоваться процентными точками, приведёнными в табл. 1, с учётом того, получено расчётное значение критерия по генеральному или по выборочному СКО.

Далее таблица для вторых значений при учёте первых

ЛИТЕРАТУРА

1. Irvin J.O. On a criterion for the rejection of outlying observation //Biometrika.1925. V. 17. P. 238 – 250.
2. Кобзарь А.И. Прикладная математическая статистика. – М.: ФИЗМАТЛИТ, 2006. – 816с.

        Далее     Содержание

© В.В. Заляжных
При использовании материалов ставьте ссылку.