9.5 Проверка нормальности при помощи вероятностной бумагиЭтот простой графический метод часто используют для первоначальной прикидки, правдоподобно ли предположение о том, что независимая выборка взята из нормального распределения. Эта прикидка осуществляется в буквальном смысле ``на глазок'', поэтому здесь не идет речь о количественных показателях, таких как вероятность ошибки и т.п. Чтобы пояснить идею этого метода, сформулируем вспомогательное утверждение. Пусть -- функция распределения закона , .
Лемма 9.1
Рассмотрим отображение , действующее по формуле
Доказательство.
Достаточно заметить, что
.
Предположим, что в нашей выборке все числа различны. Переупорядочим выборку в порядке возрастания: Из Определения 6.1 легко вытекает, что в этом случае эмпирическая функция распределения может быть выражена формулой В частности, . С другой стороны, теорема Гливенко утверждает, что при большом объеме выборки эмпирическая функция распределения близка к теоретической функции распределения. Принимая во внимание Лемму 9.1, заключаем, что если выборка действительно взята из нормального распределения , то точки должны приблизительно оказаться на одной прямой линии (а именно, на прямой ).
Замечание 9.2
Мы намеренно не включаем в перечень (55) точку, соответствующую , так как , а отображение в точках вида не определено.
Таким образом, мы пришли к очень простому глазомерному способу проверки нормальности выборки: наносим на плоскость точки Чтобы было удобнее наносить эти точки, прибегают к так называемой вероятностной бумаге. Вероятностная бумага получается выбором неравномерной шкалы координат вдоль оси ординат. А именно, на расстоянии от оси абсцисс мы ставим пометку для новой неравномерной шкалы. На вероятностную бумагу (в системе новых координат) наносят точки .
Замечание 9.3
В силу того, что данные наблюдений и измерений, как правило, округлены до некоторого знака, предположение о том, что все различны, нередко нарушается. Это приводит к тому, что в вариационном ряду некоторые соседние значения могут совпадать и формула (54) для выражения через вариационный ряд несколько видоизменяется. Но, тем не менее, изложенный выше глазомерный метод определения нормальности остается пригодным.
Замечание 9.4
Мы не используем точку , тем самым теряя некоторую информацию, содержащуюся в выборке. Имея в виду приблизительность этого метода, можно надеяться, что в случае больших выборок, эта потеря не слишком существенна. Отметим, однако, что существуют приемы, позволяющие учитывать и значение . Нетрудно модифицировать этот метод для проверки гипотез о выборках из распределений, не являющих нормальными, но зависящих от неизвестных параметров сдвига-растяжения. Детали можно найти, например, в [13, § 5.1] и [6, § 4].
Пример 9.1
Вернемся к нашему числовому Примеру 6.4 и зададимся вопросом, насколько в Примере 8.2 было обоснованным предположение о нормальности выборок и . Для этого проведем их проверку на нормальность при помощи вероятностной бумаги. Для выборки , соответствующей содержанию углерода в пробах, чертеж представлен на рисунке 3. Для выборки , содержащей значения прочности на разрыв, чертеж представлен на рисунке 4.
Видно, что и в том, и в другом случае точки располагаются вблизи некоторой прямой линии. Таким образом, имеются основания для гипотез о нормальности выборок и .
Большое число естественно-научных примеров, при анализе которых используется вероятностная бумага, содержится во второй части книги [12].
| |||||||||
А.Д. Манита, 2001-2011 |