Как заказать торт в Челябинске на свадебную церемонию.

Лабораторная работа № 10а
Критерий Андерсона-Дарлинга

Критерий Андерсона-Дарлинга применяют для проверки гипотезы, подчиняется ли случайная величина некоторому теоретическому распределению. Критерий приемлем при объёме выборки n >= 25. Проверку можно проводить для любого вида распределения, если параметры распределения предполагаются известными. Такая проверяемая гипотеза называется простой.

При простой гипотезе по критерию Андерсона-Дарлинга рассчитывают статистику

рисунок 10а.1               (10а.1)

Здесь F(xi) – значения предполагаемой теоретической функции распределения; Wi=(2i-1)/2n– накопленная частость (эмпирическая функция распределения), i – номер элемента в вариационном ряду.

Расчётное значение сравнивают с табличным Атабл. Табличные значения можно найти в табл. 10а.1.

Таблица 10a.1.
α 0,1 0,05 0,01
Атабл 1,933 2,492 3,878

При Арасч <= Атабл нет оснований для отбрасывания проверяемой гипотезы, и эмпирическое распределение считают достаточно хорошо моделируемым теоретическим распределением, имеющем функцию распределения F(x) с известными параметрами, при выбранном уровне значимости α.

Если параметры теоретического (гипотетического) распределения заранее неизвестны, оценивают, принадлежит ли эмпирическое распределение тому или иному семейству теоретических распределений, например, нормальных, экспоненциальных, логистических или других (проверяется сложная гипотеза). Часто говорят просто «соответствие <проверяемому> распределению». При проверке сложной гипотезы критерий иногда называют «критерий типа Андерсона-Дарлинга». Вместо параметров в расчётах используют их оценки, определяемые по данным выборки. Табличные значения критерия, как и для других критериев согласия при сложной гипотезе, различны для разных семейств распределений.

При сложной гипотезе расчёты проводят в следующем порядке. Значения выборки сортируют по возрастанию, т.е. записывают в вариационный ряд. Находят Арасч по формуле (10a.1). При этом F(xi) – значения интегральной функции теоретического распределения от значений выборки с оценками параметров, рассчитанными по выборке Например, для нормального распределения оценки параметров М и δ равны соответственно среднему значению выборки хср и среднеквадратическому отклонению выборки s. В этом случае F(xi) находят по статистической функции НОРМРАСП, в строке Интегральная диалогового окна ввести слово ИСТИНА).

Арасч сравнивают с табличным Атабл. Если Арасч <= Атабл, эмпирическое распределение с приемлемой точностью принадлежит к рассматриваемому семейству теоретических распределений – например, нормальных (или, как обычно говорят, случайная величина, из которой взята выборка, имеет нормальное распределение). Табличные значения критерия при сложной гипотезе для нормального распределения приведены в табл. 10а.2, для экспоненциально распределения – в табл. 10а.3. Для других видов распределений табличные значения можно найти в соответствующих источниках.

Таблица 10а.2.

α 0,1 0,05 0,01
Атабл 0,630 0,750 1,032

Таблица 10а.3.

α 0,1 0,05 0,01
Атабл 1,060 1,319 1,954

Пример 10а.1. Оценить по критерию Андерсона-Дарлинга при различных уровнях значимости, имеет ли случайная величина, из которой получена выборка, экспоненциальное распределение. Значения выборки: 5490, 5670, 5800, 11160, 12560, 18730, 20700, 22280, 26600, 31170, 39560, 43220, 45560, 46560, 48380, 57710, 58610, 62540, 65130, 83250, 104240, 148510, 153720, 156500, 162320. Предусмотреть возможность расчёта для объёма выборки до 1000.

Экспоненциальное распределение имеет интегральную функцию распределения вида

F(x) = 1- e-λx,               (10а.2)

где х – значение случайной величины (квантиль распределения), λ – единственный параметр распределения. Поскольку параметр неизвестен, и необходимо оценить принадлежность случайной величины к семейству экспоненциальных распределений, проверяем сложную гипотезу. Выполнение примера 10а.1 показано на рис. 10а.1.

рисунок 10a.1

Рис.10a.1. Расчёт для примера 10a.1.

Вводим значения выборки и сортируем их по возрастанию. Далее вводим значение уровня значимости. Рассчитываем оценку параметра экспоненциального распределения по формуле λ = 1/хср с использованием статистической функции СРЗНАЧ (при указании всех диапазонов предусмотреть возможность автоматического пересчёта при вводе до 1000 значений выборки). Рассчитываем объём выборки по функции СЧЁТ. Находим значения теоретической функции распределения по статистической функции ЭКСПРАСП (при желании можно по формуле 10а.2) и значения эмпирической функции распределения (см. пояснения к формуле 10а.1). Находим слагаемые из формулы 10а.1, и затем расчётное значение критерия по формуле 10а.1. Вводим в ячейку Е9 три табличных значения критерия, с использованием трёх функций ЕСЛИ. При этом в Е9 должно выводиться значение, соответствующее введённому уровню значимости. Формула в ячейке Е9 может выглядеть так: =ЕСЛИ(E4=0,1;1,06;ЕСЛИ(E4=0,05;1,319;ЕСЛИ(E4=0,01;1,954))).

В ячейке С11 с использованием функции ЕСЛИ выводим сообщение, является ли распределение экспоненциальнм.

Задание.
1. Выполнить расчёты по примеру 10а.1.
2. Создать электронную таблицу для проверки простой гипотезы о принадлежности случайной величины к экспоненциальному распределению с известным параметром. Проверить соответствие данных примера 10а.1 экспоненциальному распределению со значениями параметра: 0,00001, 0,00002, 0,000025, 0,00003 при различных уровнях значимости. Для выполнения задания можно скопировать созданную в первом задании электронную таблицу в другой лист MS Excel и модифицировать её.

        Далее         Содержание

© В.В.Заляжных

При копировании материалов ссылка обязательна