Лабораторная работа № 9
Критерий Шапиро-Уилка

Предложено много критериев и способов оценки вида распределения непрерывной случайной величины. Критерий Шапиро-Уилка используется для проверки гипотезы о нормальном распределении. Этот критерий надёжен при 8<=n<=50 (существует модифицированный критерий Шапиро-Уилка, применимый при n до 2000), и является более мощным, чем другие, критерии, т.е. даёт наименьшую вероятность принять нулевую гипотезу, когда на самом деле верна альтернативная, в данном случае – принять гипотезу о нормальном распределении, когда распределение не соответствует нормальному.

При использовании критерия результаты испытаний располагают в вариационный ряд и рассчитывают значения


i – номер элемента в вариационном ряду. При этом, если n чётное, k=n/2, если n нечётное, k=(n-1)/2. Значения an-i+1 находят из таблиц. Однако с приемлемой точностью значения а можно найти по зависимостям из табл. 9.1.

Таблица 9.1.
i an-i+1
1 (0,0081356n4 - 1,3596n3 + 87,592n2 - 2808,2n + 78028)/100000
2 (0,0005642n5 - 0,096475n4 + 6,418n3 - 204,59n2 + 2849,1n + 19225)/100000
3 (-0,000053n6 +0,010464n5 - 0,83717n4 + 35,172n3 - 823,97n2 + 10190n - 26059)/100000
4 (-0,00008785n6 + 0,017143n5 - 1,3644n4 + 56,8921n3 - 1321,67n2 + 16417,8n - 64907)/100000
5 (-0,0000637n6 + 0,012953n5 - 1,08323n4 + 47,9523n3 - 1197,88n2 + 16280,8n - 77227)/100000
6 (0,001213n5 - 0,22039n4 + 15,932n3 - 578,01n2 + 10675,3n - 64930)/100000
7 (0,001058n5 - 0,19846n4 + 14,8811n3 - 563,328n2 + 10954n - 74246)/100000
8 (0,0009663n5 - 0,18425n4 + 14,2448n3 - 558,464n2 + 11321,7n - 83480)/100000
9 (0,000936n5 - 0,18321n4 + 14,431n3 - 578,383n2 + 12047,5n - 94506)/100000
10 (-0,021445n4 + 3,5688n3 - 227,115n2 + 6687n - 66534)/100000
11 (-0,01937n4 + 3,3178n3 - 218,207n2 + 6675n - 70767)/100000
12 (-0,01757n4 + 3,0973n3 - 210,36n2 + 6671,5n - 74844)/100000
13 (-0,01577n4 + 2,8668n3 - 201,302n2 + 6621,8n - 78311)/100000
14 (0,4448n3 - 64,902n2 + 3325n - 51098)/100000
15 (0,4227n3 - 63,247n2 + 3332,2n - 53673)/100000
16 (0,4046n3 - 61,999n2 + 3353,2n - 56378)/100000
17 (0,3853n3 - 60,444n2 + 3354,8n - 58703)/100000
18 (0,3532n3 - 57,207n2 + 3282,5n - 59931)/100000
19 (-11,224n2 + 1322,1n - 33480)/100000
20 (-11,072n2 + 1331,1n - 35023)/100000
21 (-10,898n2 + 1337,8n - 36508)/100000
22 (-10,833n2 + 1354,4n - 38200)/100000
23 (-10,714n2 + 1365,6n - 39754)/100000
24 (335n - 15708)/100000
25 0,0035

Статистику критерия рассчитывают по формуле W =b2/nm2. Рассчитанное значение W сравнивают с табличным Wтабл. Табличные значения критерия Wтабл в зависимости от уровня значимости α находят из таблиц, однако с приемлемой точностью их можно найти по зависимостям, показанным в табл. 9.2.

Таблица 9.2.
α Wтабл
0,01 (-0,0148n4 + 2,1875n3 - 122,61n2 + 3257,3n + 55585)/100000
0,05 (-0,0113n4 + 1,656n3 - 91,88n2 + 2408,6n + 67608)/100000
0,1 (-0,0084n4 + 1,2513n3 - 70,724n2 + 1890n + 73840)/100000

Если W >= Wтабл, нулевую гипотезу не бракуют, т.е. распределение считают нормальным.

Пример 9.1. По данным примера 1.1 проверить при различных уровнях значимости гипотезу о нормальности распределения предела прочности на разрыв алюминиевого сплава.

Вариант выполнения примера 9.1 показан на рисунке 9.1.

рисунок 9.1

Рис. 9.1. Вариант расчёта для примера 9.1.

Вводим в электронную таблицу уровень значимости и результаты испытаний, упорядочиваем их в вариационном ряду, рассчитываем среднее значение, сумму квадратов отклонений от среднего nm2, объём испытаний (какие при этом целесообразно задать в статистических функциях диапазоны?), а также величину k. Очевидно, что для любого (чётного и нечётного) n можно рассчитать k по формуле k=n/2 с округлением результата вниз до целого (функция ОКРУГЛВНИЗ).

Далее находим b. Для этого вначале рассчитываем значения n-i+1. Поскольку при этом, в соответствии с формулой (9.1), i <= k, при расчёте используем функцию ЕСЛИ, в которой логическим выражением будет i <= k. При его истинности принимается значение n-i+1, при ложности - 0. (Не забывайте установить в необходимых случаях абсолютную адресацию). Затем находим значения xn-i+1. Поскольку n-i+1>= k, при расчёте используем функцию ЕСЛИ, в которой логическим выражением будет n-i+1>= k (т.е. ссылка на ячейку столбца G). При истинности этого выражения значение xn-i+1 находим при помощи функции ИНДЕКС, при ложности значение не задаём. Затем находим x используя функцию ЕСЛИ, и далее - разности xn-i+1-xi. Рассчитываем значения an-i+1 по формулам табл. 7.1. Находим произведения an-i+1( хn-i+1-xi), и по их сумме – величину b, а затем b2 и W. Рассчитываем табличные значения критерия для различных уровней значимости по формулам табл. 7.2. Из этих значений выбираем необходимое Wтабл в соответствии с заданным уровнем значимости, используя трижды функции ЕСЛИ.

Затем, если n < 8, с помощью функции ЕСЛИ выводим сообщение «ВЫБОРКА СЛИШКОМ МАЛА». При ложности этого логического выражения используем в строке Значение_если_ложь функцию ЕСЛИ для сравнивания W и Wтабл, и в зависимости от истинности или ложности логического выражения выводим сообщение, является ли распределение нормальным. В результате в одной ячейке (в примере – ячейка D18) должно выводиться одно из трёх сообщений, например: ВЫБОРКА СЛИШКОМ МАЛА; РАСПРЕД. НОРМАЛЬНОЕ; РАСПРЕД. НЕ НОРМАЛЬНОЕ.

При правильном выполнении электронная таблица должна вер-но пересчитываться при вводе других данных в пределах применимо-сти критерия Шапиро-Уилка.

Задание.
1. Выполнить расчёты в соответствии с примером 9.1.
2. Выборочные значения случайных величин, полученные по результатам испытаний, показаны в табл. 9.3.

Таблица 9.3.
№ выборкиР Значения в выборке
10,9 855 875 834 872 863 855 888 864 870 881 891 872
20,95 11 12 9 16 12 8 9 10 10 9 11 10 8 8
30,99 34 36 38 33 34 32 30 36 38 31

Предполагается, что случайные величины распределены нормально.. Используя созданные электронные таблицы, исключить грубые ошибки по критерию Ирвина, проверить нормальность распределений, в случае нормального распределения рассчитать интервальные оценки параметров этих распределений. Результаты занести в таблицу 9.4.

Таблица 9.4.
№ выборкиГрубые ошибкиРаспределение (норм/не норм) Оценка М Оценка σ
точечнаяИнтерв. точечная Интерв.
1 ... ... ... .... ... ...
2 ... ... ... .... ... ...
3 ... ... ... .... ... ...

        Далее     Содержание

© В.В.Заляжных

При использовании материалов, пожалуйста, ставьте ссылку