Лабораторная работа № 6
Критерий Ирвина

Далее   Содержание           
При нормальном распределении исследуемого показателя для оценки элементов выборки на грубые ошибки (грубые погрешности, выбросы, промахи) нередко используют критерий Ирвина. Здесь рассмотрен часто встречающийся случай, когда в вариационном ряду выборки оценивают сомнительное значение на одном из концов ряда

более подробно о критерии Ирвина в статье [1]

Для этого вычисляют расчётное значение критерия Ирвина:

Iрасч= |(Х1 - Х2)/s|,

где Х1 – сомнительное значение c одной из сторон ряда, Х2 предыдущее значение в вариационном ряду, s - выборочное среднеквадратическое отклонение (СКО), рассчитываемое по исследуемой выборке с учётом сомнительного значения.

Полученное расчётное значение сравнивают с табличным Iтабл, которое зависит от объёма выборки n и принятого уровня значимости α. Если Iрасч > Iтабл, то сомнительное значение считают выбросом. Iтабл находят из соответствующих таблиц. Однако при автоматизированной обработке данных удобно рассчитывать Iтабл с приемлемой точностью по зависимостям, показанным (для первых значений ряда) в табл. 6.1, при изменении объёма выборки n в пределах от 3 до 1000.

Таблица 6.1.
α Iтабл
0,01 -104,84n-3 + 257,04n-2,5 - 249,02n-2 + 114,69n-1,5 - 29,78n-1 + 6,217n-0,5 + 1,0504
0,05 -89,417n-3 + 165,87n-2,5 - 143,77n-2 + 67,727n-1,5 - 17,755n-1 + 4,323n-0,5 + 0,711

Пример 6.1. Результаты испытаний представлены в ряду: 32, 27, 28, 29, 30, 29, 39, 30, 31, 26. Оценить наличие промахов, исходя из предположения о нормальном распределении.

Возможный вариант расчёта примера 6.1 показан на рисунке 6.1.

рисунок 6.1

Рис.6.1. Вариант расчёта для примера 6.1.

Вводим результаты испытаний и принятый уровень значимости, рассчитываем n и s (целесообразно задать при этом такие интервалы в статистических функциях СЧЁТ и СТАНДОТКЛОН, чтобы таблица правильно пересчитывалась при объёме выборки до 1000). Затем рассчитываем максимальное и минимальное значения вариационного ряда, используя статистические функции МАКС и МИН, а также второе и предпоследнее значения используя функции НАИБОЛЬШИЙ и НАИМЕНЬШИЙ. Далее находим расчётное значение критерия Ирвина для наибольшего и наименьшего значений, предполагая их сомнительными. При этом модуль можно найти по функции ABS.

Вычисляем табличные значения критерия при различных уровнях значимости по формулам, приведенным в табл. 6.1. Для более быстрого ввода уравнений в электронную таблицу и уменьшения вероятности ошибок целесообразно скопировать уравнения в соответствующие ячейки листа MS Excel, а затем вставить вместо n ссылки на объём выборки.Табличное значение, соответствующее введённому в электронную таблицу уровню значимости, выносим в отдельную ячейку (на рис. 6.1 ячейка Е13). Для этого используем логическую функцию ЕСЛИ. В диалоговом окне этой функции вводим логическое выражение Е2=0,01. Если это выражение истинно, то надо использовать табличное значение при уровне значимости 0,01, поэтому в строке Значение_если_истина ссылаемся на ячейку, содержащую соответствующее значение. Если логическое выражение Е2=0,01 ложно, надо вывести табличное значение при уровне значимости 0,05. Для этого в строке Значение_если_ложь вводим функцию ЕСЛИ (для этого надо открыть список в левой верхней части электронной таблицы нажатием на чёрный треугольник, выбрать Другие функции… и затем ЕСЛИ). В открывшемся при этом новом диалоговом окне вводим логическое выражение Е2=0,05. В строку Значение_если_истина нового диалогового окна ссылаемся на ячейку, содержащую табличное значение при уровне значимости 0,05. Если введённый в ячейку Е2 уровень значимости не равен одному из используемых, расчёт будет ошибочным. Поэтому в строке Значение_если_ложь второго диалогового окна вводим сообщение «ВВЕДИТЕ СТАНДАРТНЫЙ УРОВЕНЬ ЗНАЧИМОСТИ!».

Далее табличное значение, полученное в ячейке Е13, сравниваем с расчётными значениями из ячеек Е8 и Е9, используя функцию ЕСЛИ. В зависимости от результатов сравнивания выводим сообщения "выброс" или "не выброс".

Обычно при обнаружении выбросов оценивают, не являются ли они следствием технической ошибки, например, при измерении, при расчёте, при записи результата (т.е. в результате описки). Если обнаружена такая техническая ошибка, её при возможности заменяют правильным значением. Так, при ошибке в измерении проводят, если возможно, новое измерение.

Если технической ошибки не обнаружено, то результат, оцениваемый как выброс при уровне значимости 0,01, окончательно признают грубой ошибкой. Результат, являющийся выбросом при уровне значимости 0,05, но не являющийся выбросом при уровне 0,01, обычно признают приемлемым.

Задание.
1. Выполнить расчёты в соответствии с примером 6.1. Определить, какие значения являются выбросами при различных уровнях значимости. Занести результаты в табл. 6.2 (В – выброс, Н – не выброс)

Таблица 6.2.
α Минимальное значение Максимальное значение
Iрасч Iтабл Н/В Iрасч Iтабл Н/В
0,01     Н     В
0,05            
Сделать вывод о наличии грубых ошибок.

2. Определить, какие значения являются грубыми ошибками, и какие только выбросами в результатах испытаний, представленных в табл. 6.3, если предполагается нормальное распределение, и технических ошибок в случае выбросов не обнаружено. Проставить против каждого номера выборки соответствующее значение и обозначение В, О или Н

Таблица 6.3.
№ выборки Результаты испытаний
1 133 123 125 131 142 135 162 131 135 138 132 127
2 14 11 13 15 13 14 23 16 13 24 15 -
3 49 33 48 49 50 47 45 48 50 51 52 44
4 280 221 272 280 285 277 219 290 268 279 292 -
5 46 55 56 45 44 58 49 50 37 - - -
6 8 8 7 4 9 7 7 11 16 6 7 10
7 155 142 163 174 153 155 191 139 166 171 - -
8 6 8 7 6 8 5 3 8 7 8 8 6
9 562 555 570 568 547 582 578 524 622 559 560 -
10 71 91 66 66 58 70 67 53 87 - - -

ЛИТЕРАТУРА

1. Заляжных В.В. Расширение области применения критерия Ирвина при обнаружении аномальных измерений. Вестник СибГУТИ. 2020;(2):95-100.

        Далее     Содержание


© В.В.Заляжных

Комментарии, замечания, предложения на z9876543@rambler.ru
При копировании материалов, пожалуйста, ставьте прямую индексируемую ссылку на сайт
Рейтинг@Mail.ru