6.2 Эмпирическая функция распределения ... 6 Обзор методов математической ... 6.4 Выборочное среднее и ...

6.3 Гистограмма

Помимо эмпирических функций распределения, наглядное (но, вместе с тем, довольно приближенное) представление о неизвестном распределении можно получить при помощи гистограмм. Пусть -- независимая выборка из неизвестного распределения . Выберем два числа и , , такими, чтобы все числа попали внутрь интервала . Разобъем этот интервал на конечное число меньших интервалов:

где . Обозначим через длины интервалов разбиений. Теперь произведем так называемую группировку данных (выборки), а именно, для каждого интервала разбиения объединим в группу те , которые попали в этот интервал. Пусть -- число таких элементов выборки:

Определим функцию

График функции и называется гистограммой.

Таким образом, гистограмма представляет собой график кусочно-постоянной функции, такой, что площадь столбца с основанием, например, равна частоте попадания измерений в этот интервал группировки. Вспоминая материал   3.4, можно заключить, что гистограмма является выборочным аналогом плотности распределения.

При построении гистограмм мы имеем свободу в выборе интервала , числа интервалов разбиения и самих точек . Для получения хороших приближений для плотности неизвестного распределения следует всякий раз учитывать специфику конкретных данных. Самые общие рекомендации по выбору этих параметров таковы.

  • Значение должно быть существенно меньше, чем объем выборки , но вместе с тем не слишком малым, чтобы гистограмма имела достаточно подробный профиль.
  • Интервалы разбиения следует выбирать так, чтобы каждый из них содержал ``достаточно много'' элементов выборки. Если в группах недостаточно большое число данных, то возможные случайные флуктуации их числа приводят к значительным искажениям реальной картины.
При больших объемах выборки нередко берут разбиение интервала на подинтервалы одинаковой длины.

 

А.Д. Манита, 2001-2011
Хостинг от uCoz